语音人工智能技术正在迅速发展,有望将企业运营从客户服务转变为内部通信。
在过去的几周里,OpenAI 推出了新工具来简化 AI 语音助手的创建,并将其高级语音模式扩展到更多付费客户。微软更新了 Copilot AI,增强了语音功能和推理功能,而 Meta 则将语音 AI 引入了其消息应用程序。
IBM 杰出工程师 Chris Hay 表示,这些进步“可能会改变企业与客户交谈的方式”。
AI语音客服
海伊设想各种规模的企业与客户互动和管理运营的方式将发生巨大转变。他表示,人工智能驱动的通信工具的民主化可以为小企业与大企业竞争创造前所未有的机会。
“我们正在进入人工智能联络中心时代,”Hay 说。 “每个夫妻店都可以拥有与企业同等水平的客户服务。那真是难以置信。”
Hay 表示,关键是开发实时 API,以实现人类与人工智能之间极低延迟的通信。这使得人们在日常对话中所期望的那种来回交流成为可能。
Hay 指出:“要进行自然语言语音对话,模型的延迟需要在 200 毫秒左右。” “我不想等三秒钟……我需要尽快得到回应。”
开发人员可以通过 OpenAI 等公司提供的 API 来使用新的语音 AI 技术。 “有一个大规模生产的开发人员 API,任何人都可以调用该 API 并为自己构建该功能,而只需要非常有限的模型知识和开发知识,”Hay 说。
其影响可能是深远的。 Hay 预测,随着各种规模的企业采用该技术,未来几个月和几年将出现“音频虚拟助理的大规模浪潮”。这可能会带来更加个性化的客户服务、新的人工智能通信行业的出现以及工作岗位向人工智能管理的转变。
对于消费者来说,这种体验可能很快就与与人工客服交谈没有区别。 Hay 指出,最近通过 Google NotebookLM 进行的人工智能生成播客演示就是该技术已取得多大进展的证据。
“如果没有人告诉我那是人工智能,老实说我不会相信它,”他谈到这样一个演示时说道。 “声音充满感情。现在你可以与人工智能实时对话,这会变得更好。”
人工智能声音变得个性化,毫不夸张
各大科技公司都在竞相增强人工智能助手的个性和能力。 Meta 的方法包括在其消息平台上为其人工智能助手引入名人的声音。用户可以选择基于奥卡菲娜和朱迪·丹奇等明星的人工智能生成的声音。
然而,伴随着承诺而来的是潜在的风险。海伊承认,如果这项技术落入坏人之手,可能会给诈骗者带来福音。
他警告说:“在接下来的六个月内,你将看到新一代的骗子,他们的声音听起来很真实,就像你听到的那些播客主持人一样,声音中充满了语调和情感。” “本质上,这些模型是为了从人们身上骗钱。”这可能会使传统的危险信号变得过时,例如不寻常的口音或机器人般的声音。 “这将被隐藏起来,”海伊说。
他将这种情况比作《哈利·波特》小说中的情节点,角色必须提出私人问题来验证某人的身份。在现实世界中,人们可能需要采取类似的策略。
“我怎么知道我正在与我的银行交谈,”海伊沉思道。 “我怎么知道我正在和我的女儿说话,她要钱呢?人类必须习惯于提出这些问题。”
尽管存在这些担忧,海伊仍然对该技术的潜力持乐观态度。他指出,语音人工智能可以显着提高可访问性,使人们能够用母语与企业和政府服务互动。
“想想福利申请之类的事情,对吗?你会得到所有这些令人困惑的文件。想象一下能够以您的母语致电(您的福利提供者)的能力,然后能够将事物(非常复杂的文档)翻译成您更容易理解的更简单的语言。”
人工智能语音技术不断发展,Hay 认为我们只触及了潜在应用的表面。他设想未来人工智能助手将无缝集成到可穿戴设备中,例如 Meta 最近推出的 Orion 增强现实眼镜。
“当实时 API 戴在我的眼镜上时,我就可以在移动时实时与其对话,”Hay 说道。 “与 AR 相结合,这将改变游戏规则。”尽管他承认存在道德挑战,包括最近发生的智能眼镜能够立即发现人们身份的事件,但海伊仍然看好这项技术的前景。
“道德规范需要制定,而道德规范至关重要,”他承认。 “但我很乐观。”
电子书:如何选择合适的基础模型
这篇文章有帮助吗?
是的不