人工智能对话由两部分组成:自然语言理解(NLU)

ai人工智能信息资讯 2021-03-20 14:49200网络整理阿特

人工智能对话是人工智能的一个子领域,专注于在人与计算机之间生成自然而无缝的对话。近年来,像Amazon Echo和Google Home这样的语音助手的发展速度已经飞速增长。据估计,2018年将有近1亿台设备用于家庭。不仅如此,我们还在自动语音识别(ASR),文本到语音(TTS)和意图识别方面取得了惊人的进步。

但是要实现科幻小说中描述的人与机器之间的顺畅对话,我们还有很长的路要走。在未来十年中,我们应该看到这些关键的发展,它们将使我们更接近这个长期愿景。

机器学习之外的新工具

在过去的几年中,机器学习,尤其是深度学习,已经成为人工智能领域中一种非常广泛使用的技术。它在人脸识别,语音识别和对象识别领域取得了重大进展,因此许多人认为它将解决人工智能对话的所有问题。但是,实际上,它只是我们工具箱中的一个有价值的工具。我们需要其他技术来管理有效的人机对话的各个方面。

机器学习特别适合解决在大型数据库中查找模式的问题,或者如Turing获奖者Judea Pearl所说,机器学习实际上是在解决曲线拟合的问题。人工智能对话中有几个问题可以很好地反映这种解决方案,例如语音识别和语音合成。尽管该技术用于捕获具有固定形式或语义的自然语言,但该技术也已应用于意图识别(将人类语言中的文本句子转换为用户意图或愿望的高级描述),并获得了巨大的成功。敏感和am昧。某些限制。

但是,在计算机对话中确实确实存在一些不适合机器学习的问题。人机对话包括两个部分:

自然语言理解(NLU)-了解用户所说的话

人工智能对话_智能对话娃娃_自动智能对话机器人cleverbot

自然语言生成(NLG)-为用户提供合理的口头反应

最近,大多数注意力都集中在第一部分,但是仍然存在许多挑战,而这些挑战不适合机器学习的原因是,言语反应的产生不仅仅是收集和收集的产物。分析大量数据。在接下来的几年中,这种持续而有状态的对话挑战仍将需要更多地关注NLG和对话管理问题。

更高的保真度体验

当前的对话体验可能非常简单且受限制。为了超越这些限制,我们需要支持高保真对话。实现此目标有几个方面,包括:

广泛而深入的对话。如今,大多数对话既广泛又简短(例如,“现在几点?” =>“现在是上午9:45”),或者狭窄而有意义的对话(例如,问答游戏中的多轮对话)。为了超越这些有限的经验,我们需要进入一个广泛而深刻的对话世界。这需要更好地了解用户输入的上下文含义,以便可以做出适当的响应,可以跟踪对话的状态,并且一次能够转换数百种意图的能力超出了当前技术的限制。

个性化。在两个人之间的自然对话中,每个人通常会借鉴与其他说话者的先前经验,以根据另一个人做出相应的回答。不这样做的计算机对话会让人感到不自然,甚至令人讨厌。从长远来看,解决此问题需要解决诸如说话者识别之类的挑战,以便计算机知道您是谁,并且可以对您和其他人做出不同的反应。另一个方面是跟踪以前的对话状态,并随着时间的推移做出不同的响应,例如了解特定用户的偏好或风格。

多模式输入和输出。当前,人工智能对话的重点是理解语音输入并生成语音响应。但是,用户可以通过许多不同的方式提供输入,也可以以不同的形式生成输出。例如,除了提供语音输入外人工智能对话,用户还可以按下屏幕上的按钮,或者可以使用情感分析为计算机提供可以对其进行反应的情感级别的输入。同时支持多个输入或输出带来了一系列考虑因素。复杂性。例如,如果用户在按下“是”按钮时说“否”,那么系统应该怎么做?

在循环中找到适合人类的角色

人工智能对话_自动智能对话机器人cleverbot_智能对话娃娃

作为技术人员人工智能对话,我们经常被迫尝试解决计算机的所有问题。但是,应该指出的是,某些领域,例如游戏,娱乐或销售和市场营销,总是想巧妙地设计计算机响应的声音和个性以匹配其品牌。另外,已经注意到,尝试生成全自动自然语言生成可能不是最好的方法,因为最自然的人类对话不是重复许多先前对话的结果,而是通过考虑当前上下文而形成的。

今天,这些创造性的输入必须仍处于人类写作的水平。系统可以识别每个上下文的含义,并定义对话应如何进入下一个主题。这就是目前几乎所有计算机对话的工作方式。在接下来的几年中,我们似乎不太可能完全消除这种循环,因此 人工智能对话由两部分组成:自然语言理解(NLU) ,展望未来,我们希望建立一种方法,以支持更多的可扩展性和多种定义人的声音和语气的机制。例如,可以在更抽象的层次上定义其关键特征。

电视连续剧《西方世界》很好地展现了这种世界观。在反应和行为方面,人工“宿主”显然非常复杂,通常与真实人类没有区别。但是,这是通过“叙述”部门的许多作者来实现的,他们定义了每个人的内容及其各种高级人格特征。创意设计师可以使用功能强大的视觉创作工具来调整这些因素。

在未来几年中,该领域将受益于灵活的创作工具的开发,类似于Photoshop和其他针对艺术家或Final Cut Pro授权的视频创作者的工具。

与更丰富的语言生成和对话管理系统工具相结合,更高的保真度体验和在循环中更好地使用人类会产生更好的内容,最终使我们进入一个快乐而连续的计算机对话体验世界。

作者| MARTIN REDDY

来源|冒险



重工业设计工程机械加工设备_ai人工智能机器人-专业技术培训系统  备案号:

联系QQ: 邮箱地址: