加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码网 (https://www.900php.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 移动互联 > 数码 > 正文

欢迎来到和机器聊天的2.0时代

发布时间:2018-04-24 11:34:32 所属栏目:数码 来源:站长网
导读:副标题#e# 能够对话的语音助手已经成了互联网科技巨头的标配,不管做操作系统、搜索引擎、电子商务还是硬件终端,大家都得有个人工智能支持的女性声音跟用户聊几句天。但是“你有没有觉得跟人工智能对话很费劲?”周力在微软北京总部的办公室对记者提出这个
副标题[/!--empirenews.page--]

能够对话的语音助手已经成了互联网科技巨头的标配,不管做操作系统、搜索引擎、电子商务还是硬件终端,大家都得有个人工智能支持的女性声音跟用户聊几句天。但是“你有没有觉得跟人工智能对话很费劲?”周力在微软北京总部的办公室对记者提出这个问题。

2018年3月28日,微软小冰团队的两位负责人李笛和周力与科技媒体沟通了小冰在人工智能对话领域最新的技术进展。

欢迎来到和机器聊天的2.0时代
李笛介绍微软眼中的人工智能对话平台最新进展

● 为什么跟机器对话不自然

微软在Windows 10内置的小娜语音助手估计是普通用户最容易接触的智能对话机器人。但相信大家能注意到在使用语音跟小娜交流时,往往都会用比较正式的语气口齿清晰地跟她沟通。其他语音对话机器人也不能例外,即使它们好像学会了开玩笑,用户也很少能用放松的方式对着机器说话。

微软注意到用户在通过语音完成任务之外,人机对话的情感需求也很重要,于是另辟战场,在2014年发布了有具体人格和个性的微软小冰,探索在人机对话中人类情感需求的满足。实践证明,小冰选择的情感计算之路在增强互动、延长对话层面有了明显进步,每轮对话的次数远远超过其他对话程序。

但即使面对小冰,人类也往往不由自主地选择比较紧张的方式进行说出语音。这其中重要的原因,周力和他的团队认为是机器说完了人再说,一人一句轮流发言的形式并不是真正的对话。如果我们认为在语音交流层面,电话和面对面谈话差不多,与人工智能对话更像是两个人拿着对讲机交谈。

用通信行业的术语来说,对讲机交流是半双工传输,而人类自然交谈是全双工——通信双方可以随时发送和接受信息,也就是可以同时说话、边听边说。拿着对讲机说话,因为无法得到对方的实时反馈,人们传达的内容就会不由自主地调整到尽量清晰、简明的程度,也就是“说话费劲“的原因。

● 对话的河流

机器跟人对话是怎么实现的?具体的技术细节恐怕普通用户不容易掌握,但是在大框架上,目前各大公司使用思路都差不多:收到语音之后理解用户说的内容,从中找到对应的任务,然后想办法完成并反馈给用户。但这只能实现对讲机式的交流,在现有技术平台上,这种技术思路已经比较成熟。微软认为实现持续、全双工的感官式交流才有更大的发展空间,这就需要全新的技术框架。

欢迎来到和机器聊天的2.0时代
现有AI对话机器人大多基于具体任务,继续提升体验已经比较困难

传统实现方法被行业称为Turn-oriented框架,微软表示可以翻译为面向单一任务的框架。微软小冰全球负责人,微软(亚洲)互联网工程院副院长李笛向记者解释了其中的原理:“以单一任务为目标,每一个对话就像是来到了一个十字路口。在路口中间有指挥交通的民警,每次当你输入一个命令,民警只负责把你迅速引导到干这个事的地方去。”

“比如你要问天气,他迅速把你引导到提供天气内容,然后把天气内容提炼出来,以对话的形式输送给你。当天气的任务完成以后,这个民警就把你拉回到十字路口中心来,一切都归零了。然后你再问出下一个问题的时候,他发现你还要去另外一个地方,就把你引导到另外一个地方进行。”李笛用具体的例子解释。

如果这个系统无法完成用户要求的任务,一个意外处理功能可以实现搜索协助,给用户展示对应的网络搜索结果,最终还是回到原点,等待下一个任务。

在人工智能的起步阶段,Turn-oriented框架可以高效、准确地实现目标任务,所以获得了几乎所有对话应用的青睐。但它的问题就是不像人,不能实现自然、轻松、持续的对话,给用户的感觉还是在和机器打交道,自然用起来就有些费劲。

欢迎来到和机器聊天的2.0时代
微软认为面向对话全程的框架相比以前的实现方法能实现更自然的交互

李笛认为,新的Session-oriented框架(面向对话全程的框架)将提供自然流畅的对话体验,有更大的发展空间。“对话像河流一样,我们认为任何的一个自然发生的对话,都是混合的。她就像河流一样,从一个turn往下一个turn走,这个turn可能跟任务有关,但是这个任务之后可能会进入到进一步的交流。随着进一步的交流有可能引发出新的任务,然后再随着新的任务引发一些知识的了解,然后走下去,持续流转。”

与现有的实现方法相比,我们可以看到Session-oriented框架在完成单个任务完之后,系统并没有回到原点,而是像河水流到了下游,对话进入了新的阶段。如果能实现持续的对话,在其中完成多个任务,用户的满意程度就不再局限于单个任务的成败,全体对话的体验将更重要。

有些任务传统的对话方式已经能解决,但用户体验不好。比如手机推荐,传统人工智能对话需要持续询问很多问题才能给出比较精确的答案。任务完成了,但用户很痛苦。而这个痛点,李笛希望能在Session-Oriented框架中得到改善。

● 从局部到整体的视角转换

人工智能经常被网友戏称为人工智障,但并不能否认在特定领域它们已经能很好地完成任务甚至完胜人类,比如下棋、图像识别等应用场景。在传统的AI语音对话领域,完成特定任务也成为核心价值,但我们人类对交流的期望远不止查一下天气和讲笑话。微软这一次提出面向对话全程的理念,抓大放小,从另一个维度让我们看到了人工智能发展的方向。

以对话全程为考量,以往你来我往轮流发言的形式就不行了,人工智能需要具备边说边听、被打断和恢复、甚至插嘴的能力。为了保持对话,人工智能还需要对用户身份、情绪有适当的理解,从而引导对话持续进行。

欢迎来到和机器聊天的2.0时代
全双工的语音交流模式和以往差异很大

(编辑:源码网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读