本周,谷歌在 I/O 大会上预览了 Google Assistant 的一项新功能。这项功能名为 Google Duplex,其目的是代替我们拨打电话,以自然流畅的方式进行对话,以帮助执行“现实世界”的任务。 任何足够先进的技术都与魔法无异 阿瑟·克拉克 这是一个经常被滥用的短语,在新闻业中是被禁止的,但在听了谷歌独立预订餐桌和预约理发的演示后,这位编辑真诚地认为它在这里很适用。 如果你还没有听过 Google Duplex 的操作,那么请听下面的例子: Duplex 安排理发预约: 这听起来很诡异,不是吗?Google Duplex 甚至与“图灵测试”有关。图灵测试是艾伦·图灵在 50 年代开发的一项测试,用于确定人工智能的行为是否与人类的行为没有区别 - 确实值得高度赞扬。当然,我们只听到了最好的例子,即使我们很想让谷歌发布 Google Duplex 早期对话的“搞笑片段”! Google Duplex 的重大改进是,它能够进行自然的对话,这得益于它在理解、互动、计时和说话方面的进步,确保接收者不必适应与机器交谈。正是这种成功“愚弄”电话另一端的人的能力引发了哲学和伦理方面的担忧。 谷歌随后做出回应,表示 Google Duplex 会在对话过程中表明自己的身份。 Google Duplex 如何实现这一点?Google Duplex 采用 TensorFlow Extended (TFX) 机器学习平台创建循环神经网络 (RNN),通过自动语音识别 (ASR) 和文本转语音 (TTS) 引擎根据情况控制语调来执行语音处理任务。 自动语音识别 (ASR) 将接收者的语音转换为文本,根据上下文分析文本,并通过文本转语音 (TTS) 引擎将响应转换为接收者的语音。为了达到所需的互动质量,Google Duplex 会在预约理发等特定领域进行训练。训练是实时进行的,由人工操作员监督,操作员将监控互动并在适当的时候进行干预。这些训练有素的教练会持续监督训练,直到对话达到所需的质量水平。此时,Google Duplex 可以自由地独立运行。 Google 会记录每一次通话吗?在英国和美国的许多州,你只需要一方同意,就可以合法地记录通话。但是,美国某些州要求双方同意。在呼叫该州时,Google Duplex 会无法运行吗?还是 Google Duplex 会请求许可?——如果我们听说过,那将是一个破坏对话的事件。 随着 Google Duplex 扩展到其他领域,为了满足您的要求,可能还需要知道更多的个人信息。我们可以决定不提供这些信息,但会损害 Google Duplex 所能提供的服务质量。 像我们一样说话和倾听时间上的细微差别也有助于保持自然转换。根据用户研究,Google 能够将其延迟与人们的期望相匹配。 快速回应“你好”,并在回答问题时停顿以做出更周到的回答,这更好地模仿了我们的对话方式。此外,Google 还利用语音不流畅来在对话中制造停顿,例如“呃”、“嗯”,这使得 Google Duplex 产生的语音听起来更加自然。 理解人类的反应更加困难,因为我们使用的句子很复杂,有时自相矛盾,通常不成结构,依赖于上下文,背景噪音很大。在较长的对话中,“4 人可以”可能指的是预订时间或人数。 复杂语句的示例: 我们又要犯一次新闻失礼行为,并引用另一句被滥用的引言 要让 Google Duplex 成为我们日常生活的一部分,它必须为我们和企业做好一切。我们的数字助理有多少次未能按照我们的要求去做事了? 作为用户,我们经常会放弃那些无法满足我们期望的功能 - 但有了 Google Duplex,顾名思义,它是双向的。如果另一端的企业认为由于互动不佳而浪费了时间,那么不久我们就会看到企业放弃使用 Google Duplex 的电话或完全屏蔽这些号码。 Google 表示,Google Duplex 具有自我监控功能,如果出现无法自主完成的任务,它会向人工操作员发出信号,由人工操作员完成任务。在某些极端情况下,此功能在现实中如何体现还有待观察。 从逻辑上讲,我们预计 Google Duplex 将在很多场景中发挥作用。 鉴于我们与汽车的集成程度比现在更深,设想这样的场景:在发生碰撞时,如果我们的安全气囊弹出,Google Duplex 可以自动代表我们呼叫紧急服务。 中风可能导致说话困难,这也是 Duplex 可用于呼叫紧急服务的另一个场景。只需在家中放置经济实惠的智能家居按钮,结合 IFTTT,Google Duplex 便可在出现问题时为老年人呼叫帮助。 对于大多数人来说看似平凡的任务对于残障人士来说却极具挑战性。在这些情况下,Google Duplex 将真正解放这些人士。 一旦支持更多语言,我们度假和侨民的体验将得到极大改善。 目前,Google 专注于 Google Duplex 为我们发起呼叫。Duplex 在我们忙碌时接听我们的电话并采取适当的行动之前,这并不是一个巨大的飞跃。 即使在今天,它似乎至少能够为我们转录语音邮件。如果电话/转录来自 Duplex 第一次拨打时“忙碌”的美发沙龙,它也会采取行动并回拨。或者更有用的是,直接回复美发沙龙的回电。 有了 Google Duplex 打电话,我们的思维自然而然地超越了智能手机。随着 Google 的触角不断扩大,包括我们的手腕、电视、扬声器和厨房里的数字显示屏,我们完全有可能从所有联网设备发起请求,而无需掏出手机。 从字面和比喻意义上讲,您还没有听到 Google Duplex 的最新消息,Google 计划于今年夏天进行测试。但与此同时,您可以听听下面的一些其他示例: 复式预订桌: 处理中断: 进一步阐述: 另一家餐厅预订: 询问节假日营业时间: 来源 |
小米已在 CCC(也称为 3C)上认证了一款新的 55W 快速充电器,多产的泄密者Digital C...
苹果上个月底发布了 iOS 11.4 更新。此次更新包含许多新功能和变化,但似乎也带来了一个严重问题...
随着三星 Galaxy A52s 的发布日渐临近,有关这款手机的详细信息也不断涌现。昨天,我们看到了...
Galaxy S21 三款产品将于下周开始发售,虽然将在多家零售商处发售,但部分颜色仅在三星在线商店...
Oppo 子品牌 Realme 正在庆祝其用户数突破 100 万,这一成绩令人印象深刻,因为它还很年...
Pocophone F1 在印度以 Poco F1 的名称出售,由于其低廉的价格和骁龙 845 芯片...
TCL 通讯因在过去几年中成为阿尔卡特和黑莓智能手机的授权商而闻名,但现在其产品组合正在扩大。该公司...
两个月前,三星宣布推出旗舰 Galaxy Tab S 系列中价格更实惠的新成员,而成熟的旗舰机型 G...
Oppo 推出了备受期待的 Reno5 系列,该品牌还推出了 Oppo Watch 和 Enco X...
如果您想尝试三星的 Gear 360 相机,您可能想看看亚马逊提供的优惠:该零售商将该设备的标价为 ...
谷歌推出了针对低端配置廉价智能手机的 Oreo(Go 版),瞄准发展中市场。除了优化的操作系统外,该...