欢迎来到和机器聊天的2.0时代
这对现在的人工智能研究者来说,是全新的挑战,甚至可能需要颠覆和重组整个底层架构。微软小冰在情感计算领域的早发优势应该是激励他们最先提出这个理念的资本。小冰代表的情感计算能力是保持和引导对话的基础,而以小娜为代表的智能计算能力,则可以完成对话河流中用户的任务。 通过对话完成任务是很重要的价值,但如果用户觉得不方便,这些功能可能永远被打入冷宫。”真正重要的并不是有100个、或1000个功能,而是用起来到底费劲不费劲,如果我费劲的话,你有再多的功能,我可能尝试一下之后,就不经常使用。但如果交互变得很自然,哪怕功能很少,用户可能也会经常去用,甚至像我们天天用手机一样,上瘾地玩。“周力表示。 李笛和周力都认为,产业现存的人工智能对话都将遇到难以继续成长的天花板,而以对话全程为基础的思路,能够提供更自然的对话体验,将是未来的方向。包括苹果、亚马逊、facebook等重要的人工智能公司都将把产品重点转向对话的持续性。 除了软件架构的变化,硬件感官的进步也是需要的。微软现在还没展示人工智能对话的视觉能力,但根据相关信息推测,他们已经做了很多工作,或许年内我们就能看到小冰能够观察用户和环境,甚至以具体的形象出现在屏幕上了。 ● 从对讲机升级到电话的挑战 人工智能对话实现从对讲机半双工到电话的全双工,技术上需要克服的挑战很多。周力给记者举了几个例子。 首先,机器需要边听边想,并及时反馈。人与人的对话正是如此,我们在听别人说话的时候已经开始思考怎么回答了,往往对方一结束我们就能立即接上话。对人工智能来说,就需要持续接收用户语音,对整体意思进行预测并开始组织答案。如果等到说完了再开始处理,考虑到网络延迟以及某些任务的处理时间(比如操作智能硬件),或许要等很久才能有反应。如果用户说完就能得到实时反应,哪怕任务结果还没有反馈,也会是很好的体验。
其次,保持对话节奏,说什么和什么时候说也非常重要。在持续的对话中,语音是不能像微信消息一样一气儿发出来的。人工智能自己需要协调先后到达的内容,哪些更重要,把更重要的东西先说出来,甚至忽略掉还没说但已经不需要的信息。机器也可能在讲话时被人打断,那么它应该继续说下去,还是该收口?如果立即回应,是不是后面还需要接上自己前面的话。这些都是半双工,或者说面向单一任务模式不存在的挑战。 再次,如何协调不对称的交流以及让对话持续。面向任务的交流一般是一来一往,人和机器的沟通处于同一个量级。但是人和人的对话经常出现一个倾听一个倾诉的情况,在人工智能对话中,需要解决这样的场景。在对话中,如果出现冷场,人工智能是结束对话,还是想办法持续话题?这也是传统人机对话没有怎么考虑的问题。 还有,人工智能如何识别对话者的身份、情绪和场景。给大人讲鬼故事没问题,但如果小朋友听到了就不妥。说我爱你和唱我爱你,机器给出的回应也不应该一样。对话中如果来了别人,说话者接了个电话甚至家里电视开始播放电视剧,机器怎么识别这样的场景又是更复杂的问题。 很明显,这些新的对话需求以往的任务式对话技术很难满足。微软小冰最初的对话引擎基于大数据搜索技术,通过学习用户的对话,找到最适合当前场景的回答,效果相当好。但是这种模式基本上不能让人工智能产生新的内容,必须依赖大数据尺度下用户的数据贡献。 在基于对话的场景中,微软采用了生成模型以满足边听边想、动态调整内容的能力。周力表示,“从目前能产生的对话质量来说,(生成模型)和我们之前的搜索技术是相当的,但生成模型本身本身更适于一种引流性交互的模式。”可以期待,随着生成模型的完善,小冰的对话能力终将超越以往的搜索技术,给交流带来更好的体验。 ● 更自然的智能对话可以无所不在 在微软的眼里,以小冰为代表的人工智能对话能力可以接入任何具备语音功能的智能设备,如果不需要物联网硬件控制能力,对这些设备来说,接入小冰只是多一个IP语音流连接到云端,没有什么复杂的开发工作。最新的案例是微软与小米生态合作,在Yeelight语音助手中植入了小冰。用户可以自由选择与小米的小爱同学或者微软小冰对话,小冰还可以控制大多数小米生态链的智能产品。 在幕后,小冰的技术平台实际上已经有了很多的落地应用。小冰是很多媒体的人工智能主持人、在日本罗森便利店的智能助手、甚至已经在大多数国内的陪伴机器人中给小朋友讲故事了。李笛表示,微软小冰在国内市场上有三种合作方式。第一个是提供人工智能解决方案,相比其他产品更关注终端产品的用户体验。第二还能提供内容和服务,包括资讯资源的整合,以及启动相关任务,如智能设备的控制。第三则可以利用人工智能的创造能力,提供内容服务。 实际上,根据搭载的硬件场景不同,尽管接入的同样是微软小冰,她的功能和特性也会有差异,小冰是一个可以有不同面目和功能的对话平台,而不是具体的定型产品。比如在普通的语音助手设备上,实时信息的输入基本上只有语音,而在车载设备上,对话随时可能被驾驶信息打断,两种场景下的处理方式并不相同。在微信等消息平台上,以搜索模型为主的内容可以提供更安全可靠的交流,而物联网智能设备上的小冰可以用生成模型适应更灵活的的对话。 对话式的人工智能现在还没有成为不可替代的应用,甚至大多数人几乎不用。所以有人会认为小冰只是微软研究未来技术的一个实验性产品,不会成为Windows 、Office这样商业化的应用。但是别忘了,微软两年前就提到过一个概念:对话即平台。以小冰为代表的持续性对话能力很可能成为微软未来某个核心业务的基石。如果把现在大多数语音对话机器人称为1.0一代的话,以对话全程体验为目标的微软小冰,给我们展示了智能对话2.0时代的样子。 本文属于原创文章,如若转载,请注明来源:欢迎来到和机器聊天的2.0时代http://news.zol.com.cn/683/6834288.html (编辑:源码网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |