加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码网 (https://www.900php.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

身价4000万的汪仔火了后,我们来聊聊人工智能技术

发布时间:2017-02-20 05:26:08 所属栏目:传媒 来源:量子位 春天来了,又到了人机交战的季节。 七年前的二月,IB
导读:副标题#e# 原标题:权威详解:《一站到底》里的AI汪仔,到底靠什么技术碾压人类 来源:量子位 春天来了,又到了人机交战的季节。 七年前的二月,IBM人工智能计算机Watson在答题节目《Jeopardy!(危险边缘)》中称王,击败了这个节目历史上最强大的两位人类高
副标题[/!--empirenews.page--]

原标题:权威详解:《一站到底》里的AI汪仔,到底靠什么技术碾压人类

来源:量子位

春天来了,又到了人机交战的季节。

七年前的二月,IBM人工智能计算机Watson在答题节目《Jeopardy!(危险边缘)》中称王,击败了这个节目历史上最强大的两位人类高手。这个二月,搜狗人工智能机器人汪仔在答题节目《一站到底》中登场,击败了站到最后的人类选手。

在《jeopardy!》里,最强的人类选手最后不得不写下名句,俯首称臣;而在《一站到底》的赛场上,汪仔也表现出碾压般的优势。同样是答题节目,同样是人工智能,七年时间过去,现在的汪仔和当年的Watson,到底有何不同?

而号称历时9 个月,耗资4000 万打造的汪仔,背后到底是哪些核心技术,研发过程又有哪些挑战?未来人工智能技术又会怎样发展?

身价4000万的汪仔火了后,我们来聊聊人工智能技术

 

△ 图左为许静芳,图右为刘明荣

搜狗搜索技术负责人许静芳,以及搜狗搜索总监刘明荣,把上述种种问题的答案抽丝剥茧告诉量子位。下面是他们的权威详解:

汪仔和当年的Watson有什么不同?

1、输入方式不同

Watson是特殊接口文本输入,输入内容准确无误。

而《一站到底》是主持人念题加题板展示题目(两种来源都是逐字出题),汪仔通过搜狗的语音识别和图像识别技术,利用语音和图像两种方式获取,再转换成文字。语音识别、图像识别都是AI的关键技术,同时识别的错误会进一步提升答题的难度。

2、题目设置不同

《jeopardy!》的题目有显示类别和相应的奖金数,类别对于答题有帮助,能够将答案限定在特定范围内。而《一站到底》中的题目没有给出类别,需要汪仔通过算法识别问题的类别,增大了答题的难度。

当然《jeopardy!》中题目的奖金不同,最后以获得的奖金数定输赢也带来了新的问题,这点是一站到底所没有的特性。

3、赛制不同

《jeopardy!》必须主持人把题目完整念出后选手才能抢答,而《一站到底》是在开始念题后任意时间都可以抢答,答对自己得分,答错对方加分。

因此在高水平的选手有大量的题目都是在题目尚未完整时就作答,汪仔同样有很强的抢答,即根据题干片段去预测问题并作答的能力,这是Watson所不具备的能力。

4、知识获取方式不同

Watson是一个封闭系统,不联网,利用其离线的知识库答题。而汪仔通过联网,对全网信息及搜狗知识图谱进行在线答题,在利用更大范围信息的同时也对答题速度提出挑战。

5、其他

汪仔除了能回答知识问题,还有聊天功能,可以和主持人进行自然语言交流。

身价4000万的汪仔火了后,我们来聊聊人工智能技术

汪仔主要基于哪些技术?

汪仔背后核心技术主要包括:语音识别、OCR、自然语言理解、数据挖掘、信息检索、知识图谱和文本计算等,这些技术是当今人工智能领域最新发展的集中体现。

其中语音识别、OCR技术代表了机器学习和深度学习的最高水平,自然语言理解是未来人工智能发展需要进一步解决的重要核心问题,代表了未来发展的重要趋势。

关于这套系统的架构,量子位还得到了一组图形化的说明。就列在下面(点击看大图)

    

身价4000万的汪仔火了后,我们来聊聊人工智能技术

 

  

身价4000万的汪仔火了后,我们来聊聊人工智能技术

 

身价4000万的汪仔火了后,我们来聊聊人工智能技术

 

身价4000万的汪仔火了后,我们来聊聊人工智能技术

 

有多少软件工程师支持汪仔?

长期投入的核心开发人员在十人左右,此外还有支持项目的各类工程师约十人。

量子位补充一点相关信息:搜狗CEO王小川此前透露,汪仔由搜狗和清华天工研究院联合开发,耗时9 个月,耗资4000 万。

研发过程中,最大的困难是什么?

《一站到底》有个非常特殊的规则:开始读题后,任何时间都可以作答。

答对得分,答错对方加分。所以答题速度非常关键,这里不仅仅是听到完整题目后能够在极短时间内答题,更重要的问题是能够根据部分题目就预测问题并作答,实际上顶尖的人类选手也很大比例在题目不完整情况下答题。

答题速度上我们做了两大类事情:第一是从接收到语音、图像开始,语音识别、图像识别、搜索、答案抽取这整个系统都在速度上追求极致。在过去几个月里后台的处理速度较刚开始提升了10 倍,无论是识别还是转换成文字后的问答,在速度上都做到极致。

第二类问题是推理,即根据部分信息预测问题并作答。我们根据学习历史上的题目,建立一套推理机制,使得机器人能够根据部分信息推理,例如 当前问题是“位于XXX的”,我们通过“位于”这个词就可以推导出问题答案是一个“地理位置”。

又例如问题中提到了“千湖之国”,则很有可能答案是“芬兰”(芬兰的别称是千湖之国),问题中提到了“穆斯林的葬礼”,则很有可能是问其作者“霍达”,这些信息是我们基于海量知识文本分析挖掘、学习得到的。

目前汪仔回答题目的80%都能在题目不完整时通过推理回答,较最初的版本有了质的飞跃。

汪仔和其他人工智能产品有何不同?

汪仔是一款自然语言问答类产品,产品功能定位决定它必须具备感知语音信号输入,并可进行认知推理的能力。

目前市面上的人工智能产品大多数仅具备感知能力,这些产品在特定领域能够辅助我们高效完成任务,比如语音识别类产品,可以帮助我们快速方便地输入文字,人脸识别类产品可以提供便捷准确的安防服务。具备认知能力的人工智能产品目前还比较少。

在自然语言理解领域,汪仔代表的智能问答就属于认知类产品,它除了具备识别人类语言文字这样的感知能力,还能够理解文字背后的含义,也就是理解人的需求,在理解需求的基础上,进一步通过推理计算获得满足用户需求的精准答案。也就是说,汪仔拥有认知推理能力。

(编辑:源码网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读