您需要了解的有关 Google Duplex 的所有信息

您需要了解的有关 Google Duplex 的所有信息

本周,谷歌在 I/O 大会上预览了 Google Assistant 的一项新功能。这项功能名为 Google Duplex,其目的是代替我们拨打电话,以自然流畅的方式进行对话,以帮助执行“现实世界”的任务。

任何足够先进的技术都与魔法无异

阿瑟·克拉克

这是一个经常被滥用的短语,在新闻业中是被禁止的,但在听了谷歌独立预订餐桌和预约理发的演示后,这位编辑真诚地认为它在这里很适用。

如果你还没有听过 Google Duplex 的操作,那么请听下面的例子:

Duplex 安排理发预约: 您的浏览器不支持音频元素。
音频由 Google 提供

这听起来很诡异,不是吗?Google Duplex 甚至与“图灵测试”有关。图灵测试是艾伦·图灵在 50 年代开发的一项测试,用于确定人工智能的行为是否与人类的行为没有区别 - 确实值得高度赞扬。当然,我们只听到了最好的例子,即使我们很想让谷歌发布 Google Duplex 早期对话的“搞笑片段”!

Google Duplex 的重大改进是,它能够进行自然的对话,这得益于它在理解、互动、计时和说话方面的进步,确保接收者不必适应与机器交谈。正是这种成功“愚弄”电话另一端的人的能力引发了哲学和伦理方面的担忧。

谷歌随后做出回应,表示 Google Duplex 会在对话过程中表明自己的身份。

Google Duplex 如何实现这一点?

Google Duplex 采用 TensorFlow Extended (TFX) 机器学习平台创建循环神经网络 (RNN),通过自动语音识别 (ASR) 和文本转语音 (TTS) 引擎根据情况控制语调来执行语音处理任务。

自动语音识别 (ASR) 将接收者的语音转换为文本,根据上下文分析文本,并通过文本转语音 (TTS) 引擎将响应转换为接收者的语音。

为了达到所需的互动质量,Google Duplex 会在预约理发等特定领域进行训练。训练是实时进行的,由人工操作员监督,操作员将监控互动并在适当的时候进行干预。这些训练有素的教练会持续监督训练,直到对话达到所需的质量水平。此时,Google Duplex 可以自由地独立运行。

Google 会记录每一次通话吗?在英国和美国的许多州,你只需要一方同意,就可以合法地记录通话。但是,美国某些州要求双方同意。在呼叫该州时,Google Duplex 会无法运行吗?还是 Google Duplex 会请求许可?——如果我们听说过,那将是一个破坏对话的事件。

随着 Google Duplex 扩展到其他领域,为了满足您的要求,可能还需要知道更多的个人信息。我们可以决定不提供这些信息,但会损害 Google Duplex 所能提供的服务质量。

像我们一样说话和倾听

时间上的细微差别也有助于保持自然转换。根据用户研究,Google 能够将其延迟与人们的期望相匹配。

快速回应“你好”,并在回答问题时停顿以做出更周到的回答,这更好地模仿了我们的对话方式。此外,Google 还利用语音不流畅来在对话中制造停顿,例如“呃”、“嗯”,这使得 Google Duplex 产生的语音听起来更加自然。

理解人类的反应更加困难,因为我们使用的句子很复杂,有时自相矛盾,通常不成结构,依赖于上下文,背景噪音很大。在较长的对话中,“4 人可以”可能指的是预订时间或人数。

复杂语句的示例: 您的浏览器不支持音频元素。
音频由 Google 提供

我们又要犯一次新闻失礼行为,并引用另一句被滥用的引言

你只有一次机会给人留下第一印象,最好把它做好

要让 Google Duplex 成为我们日常生活的一部分,它必须为我们和企业做好一切。我们的数字助理有多少次未能按照我们的要求去做事了?

作为用户,我们经常会放弃那些无法满足我们期望的功能 - 但有了 Google Duplex,顾名思义,它是双向的。如果另一端的企业认为由于互动不佳而浪费了时间,那么不久我们就会看到企业放弃使用 Google Duplex 的电话或完全屏蔽这些号码。

Google 表示,Google Duplex 具有自我监控功能,如果出现无法自主完成的任务,它会向人工操作员发出信号,由人工操作员完成任务。在某些极端情况下,此功能在现实中如何体现还有待观察。

预测下一步?

从逻辑上讲,我们预计 Google Duplex 将在很多场景中发挥作用。

鉴于我们与汽车的集成程度比现在更深,设想这样的场景:在发生碰撞时,如果我们的安全气囊弹出,Google Duplex 可以自动代表我们呼叫紧急服务。

中风可能导致说话困难,这也是 Duplex 可用于呼叫紧急服务的另一个场景。只需在家中放置经济实惠的智能家居按钮,结合 IFTTT,Google Duplex 便可在出现问题时为老年人呼叫帮助。

对于大多数人来说看似平凡的任务对于残障人士来说却极具挑战性。在这些情况下,Google Duplex 将真正解放这些人士。

一旦支持更多语言,我们度假和侨民的体验将得到极大改善。

目前,Google 专注于 Google Duplex 为我们发起呼叫。Duplex 在我们忙碌时接听我们的电话并采取适当的行动之前,这并不是一个巨大的飞跃。

即使在今天,它似乎至少能够为我们转录语音邮件。如果电话/转录来自 Duplex 第一次拨打时“忙碌”的美发沙龙,它也会采取行动并回拨。或者更有用的是,直接回复美发沙龙的回电。

有了 Google Duplex 打电话,我们的思维自然而然地超越了智能手机。随着 Google 的触角不断扩大,包括我们的手腕、电视、扬声器和厨房里的数字显示屏,我们完全有可能从所有联网设备发起请求,而无需掏出手机。

从字面和比喻意义上讲,您还没有听到 Google Duplex 的最新消息,Google 计划于今年夏天进行测试。但与此同时,您可以听听下面的一些其他示例:

复式预订桌: 您的浏览器不支持音频元素。

处理中断: 您的浏览器不支持音频元素。

进一步阐述: 您的浏览器不支持音频元素。

另一家餐厅预订: 您的浏览器不支持音频元素。

询问节假日营业时间: 您的浏览器不支持音频元素。

音频由 Google 提供

来源

<<:  Moto C2 和 C2 Plus 首次亮相渲染图

>>:  每周民意调查结果:LG G7 获得粉丝青睐

推荐阅读

据报道,三星 Galaxy A6 (2018) 将登陆 Sprint

三星于上个月初正式发布了 Galaxy A6 (2018)。从那时起,它就在欧洲上市销售,而且我们听...

诺基亚 4.2 获得 Android 10 更新,将首批在 43 个国家推出

HMD Global 两天前为诺基亚 3.2 发布了 Android 10 更新,今天该公司宣布为另...

点击此处观看 Apple iPhone 13 发布会

苹果原定于 9 月举行的发布会终于到来了,我们期待看到新的 iPhone 13 系列。发布会将于太平...

余承东在公开信中概述了华为 2019 年的优先事项

2018年,华为是一家充满反差的公司——它的智能手机销量创下了新高,但同时也因隐私问题和逃避贸易制裁...

三星 Galaxy Z Flip 官方渲染图泄露,黑色和紫色可选,规格齐全

随着手机制造商不断推出新的可折叠手机,三星 Galaxy Z Flip 成为今年最受关注的设备之一。...

Google Pixel 5 拆解视频为屏幕缝隙问题提供了更多背景信息

谷歌最新、最棒的 Pixel 5 已经开始慢慢进入市场,媒体和社区的初步印象和评论已经揭示了该设备的...

Moto E7 Plus 首次亮相,搭载骁龙 460 和 5,000 mAh 电池

经过长时间的泄露,摩托罗拉终于在巴西正式发布了 Moto E7 Plus。这款手机秉承了 E 系列的...

据传骁龙 670 是一款采用下一代 Kryo 核心的 10nm 芯片

Snapdragon 660 刚刚在移动领域站稳脚跟,但有关其继任者的传言已经开始浮出水面。这款芯片...

Micromax IN Note 1 和 IN 1B 亮相,品牌重返印度

Micromax 重返印度市场,推出两款新手机,即 IN Note 1 和 IN 1B。这两款手机均...

Realme Buds Air 正式发布,配备无线充电盒

今天,Realme 在印度新德里举办了一场大型活动,向当地人群推出了 Realme X2。在活动上,...

Canalys:2019 年第二季度百度在全球智能音箱市场排名第二

根据Canalys的最新报告,中国搜索巨头百度目前是全球第二大智能音箱供应商,仅次于亚马逊。这家仅在...