科大讯飞创始人刘庆峰：17年AI从业经验，从这10000字长文中一窥

发布时间：2016-11-26 00:21:21 所属栏目：人物来源：雷锋网

导读：副标题#e# 编者按：2016 年 11 月 23 日，科大讯飞举行了年度发布会，董事长刘庆峰的做了主题演讲，总结人工智能的过去和未来，详细讲述了科大讯飞这几年的成果。以下为刘庆峰演讲原文，雷锋网李宗仁、刘亚萌、王亚峰、李尊、张丹联合编辑整理。尊敬的各

副标题[/!--empirenews.page--]

编者按：2016 年 11 月 23 日，科大讯飞举行了年度发布会，董事长刘庆峰的做了主题演讲，总结人工智能的过去和未来，详细讲述了科大讯飞这几年的成果。

以下为刘庆峰演讲原文，雷锋网李宗仁、刘亚萌、王亚峰、李尊、张丹联合编辑整理。

科大讯飞创始人刘庆峰：17年AI从业经验，从这10000字长文中一窥

尊敬的各位领导，各位来宾，女士们，先生们，首先热烈欢迎大家光临科大讯飞 2016 年度发布会的现场，也对正在视频直播观看我们发布现场的各位朋友表示热烈的欢迎。

第三次人工智能浪潮-行业应用时代

今年是人工智能正式提出来 60 周年。在几乎去年 12 月 21 号，就在这样一个同样的会场，科大讯飞举办了“AI 复始，万物更新”的年度发布会。在发布会上，我们给大家分享了人工智能第三次浪潮可能给我们带来的无比广阔的灿烂前景。同时，也跟大家分享了人工智能在当前阶段的阶段性成果。

那么一年下来，可以说 2016 年已经成了中国人工智能的历史元年。伴随 AlphaGo 和李世石的围棋对决，人工智能引起了社会各界的高度关注，不仅是科技界、产业界，包括所有的创业者、投资机构，也包括了媒体和普通百姓，都在津津乐道人工智能的话题。

这是一年来，人工智能在互联网搜索的热度指数，一年来高度居高不下，一直处于热点，处于风口浪尖之上。

到今天这个时间点，也会有人在讨论人工智能第三次浪潮究竟是什么？第三次浪潮是否也会像前两次一样，很快也会大潮退去？是不是今天我们对人工智能未来的预测过于乐观了？这是一个真正的产业大潮还是概念的泡沫？

在揭晓给大家看科大讯飞一系列令人激动的进展之前，这是我们想跟大家探讨的话题。

要解答这个话题，我想首先要有科学的精神：用理性的思维来真正看今天的技术，到底可以达到什么样一个阶段？而不是用预言家的角度，非常感性地来做武断的判断。

人工智能最早是在 1956 年的达特茅斯会上提出来的，一批数学家、计算机专家、通讯专家包括麦肯锡、明斯基、香农等获得图灵奖、诺贝尔奖的大科学家们，共同提出了人工智能的概念。所以这个概念的诞生，就有着非常严谨的科学基础。

人工智能提出来之后，在 1970 年第一次浪潮达到顶峰的时候，就已经可以通过第一代的神经网络算法，证明了《数学原理》这本书中的绝大部分的原理。第二次浪潮在 1984 年的霍普菲尔德网络推出来，让人工智能的神经网络具备了历史记忆的功能。

但是前两次的大潮，后来都破灭了，为什么？是因为神经网络本身算法的局限性，同时也受到当时整个运算能力的一些局限。今天第三次浪潮，以深度神经网络为基础，加上大数据、云计算后台的运算平台，和移动互联网源源不断地把各种训练数据收到后台。所以，今天我们认为，人工智能的第三次大潮，已经切实到来了，已经不再是一个概念，而是可以进入一个又一个的行业。

其实在今年 3 月 9 号 AlphaGo 跟李世石对决之前，两会期间（3 月 7 号）有几十个媒体采访科大讯飞。当时在业界、舆论、围棋界，绝大部分人都认为机器今年很难获胜，但是科大讯飞在接受采访时坚定认为机器一定大比分领先。

为什么？因为围棋后台的算法是基于深度神经网络的应用，而这个神经网络的应用，科大讯飞早在今年之前就已经在很多领域取得了很好的应用成效，全球的科技产业界也做了很好的探索。谷歌是把它用到了一个大家都很关注又喜闻乐见的围棋领域。

语音合成：英语合成做到了超过普通人说话水平

我们可以看一下这个表。2006 年，深度神经网络的基本理论框架正式提出来，2011 年就开始在语音识别领域崭露头角。科大讯飞是中国第一个把深度神经网络用到语音识别领域的公司，并且在 2011年，我们在全球首次发布了云平台，宣告语音、手机的听写时代正式到来。在2012 年，在图像识别领域，深度神经网络开始异军突起，接着 2014 年机器翻译取得突破。

那么今年，我们即将给大家看到一个又一个行业的令人欣喜的成果，这些是从算法创新，到应用创新和持续数据迭代的一个结果。

在这个结果中，我们看到的首先是语音合成技术：让机器能听会说，给机器装上一个人工的嘴巴。

今年，在全球的语音合成大赛暴风雪竞赛中，科大讯飞再次获得全球第一名。今年的国际比赛比的是什么呢？比的是英语合成，而且是英语的故事级合成，也就是要求系统更加深情并茂，难度更大。但是我非常高兴的告诉大家，在今年一堆的国际的顶尖研究机构和产业界全部参加的前提下（因为 IBM 在今年年初就认为人际交互接口会是 2016 年十大技术突破的前 3 名，所以语音合成也是受到了前所未有的关注），科大讯飞再次在英文领域获得全球第一名，而且我很高兴告诉大家，不仅是全球第一，而且是全世界唯一把英语合成做到了超过普通人说话水平的技术！

科大讯飞创始人刘庆峰：17年AI从业经验，从这10000字长文中一窥

在国际比赛中，5 分是播音员的水平，4 分是普通人的说话水平，而科大讯飞是 4.2 分，第二名只有 3.9 分。也就是说，全世界，让计算机念小说风格、故事风格的语音合成，只有中国人做的超过了普通人的水平。而且，这已经不是第一年，科大讯飞已经连续 11 年蝉联了全球语音合成大赛的第一名。去年国际组织比的是印度的印地语，我们照样是全球第一，是 3.9 分。我非常高兴地告诉大家，今年的中文，我们已经做到了 4.5 分。这个我很自豪，因为，当前的中文、英文、印地语的第一名都是科大讯飞所代表的中国做出来的，这意味着我们中国用户享受了全球语音合成最高的成果。

语音识别：噪音环境下错误率为 2.24%

在语音合成的进展上，我们再看一下语音识别。大家已经看到在我说话的时候，大屏幕两边同步转写出来的字幕。在去年 12 月 21 号发布会上，科大讯飞是全球第一次，敢于在几千人的演讲现场同步把语音自动转成文字，而且现场机器跟人的对比结果表明，机器在转写准确率上大大超过了专业速记人员。

在讯飞发布之后，今年 5 月份谷歌开始发布了英文转写，国内也有一些单位开始跟风。但是我想告诉大家，即便到今天为止，能够任意不用做任何训练，在不用联网的单机情况下（为应对保密和网络的各种不同异常环境），能够做到超过 90% 的准确率的企业，全行业迄今为止只有科大讯飞一家。

（编辑：源码网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/9

尾页