李开复：从1983到2017，我的幸运与遗憾

来源：李开复　作者：李开复　责任编辑：方向　发表时间:2017-08-16 10:35　

李开复管理机构中国移动中国联通中国电信 3G 3D技术 LTE FTTx IPTV 网络视频软件移动互联网农村互联网电子商务其他

核心提示：我的导师瑞迪教授（Raj Reddy，图灵奖得主、卡内基梅隆大学计算机系终身教授、美国工程院院士）从美国国防部得到了300万美元的经费，用来做不指定语者、大词库、连续性的语音识别。也就是说，他希望机器能听懂任何人的声音，而且可以懂上千个词汇，懂人们自然

今天跟大家讲个故事。

1983-1988年，我正在卡内基·梅隆大学读计算机博士。

我正忙着暑期教书，秋天投身奥赛罗人机博弈（黑白棋游戏，那是机器第一次真正意义上打败人类冠军的比赛）。

我的导师瑞迪教授（Raj Reddy，图灵奖得主、卡内基梅隆大学计算机系终身教授、美国工程院院士）从美国国防部得到了300万美元的经费，用来做不指定语者、大词库、连续性的语音识别。

也就是说，他希望机器能听懂任何人的声音，而且可以懂上千个词汇，懂人们自然连续说出的每一句话。

这三个问题都是当时无解的问题。

而瑞迪教授大胆地拿下项目，希望同时解决这三个问题。他在全美招聘了30多位教授、研究员、语音学家、学生、程序员，以启动这个有史以来最大的语音项目。

我也在这30人名单之内。

当时的科研背景是，业界已经有类似今天深度学习的算法，但一直没有实现数据标准化，数据量也不足够大。

美国几大语音识别实验室（如MIT、 CMU、 SRI、 IBM、贝尔实验室）都是各用各的数据库，测试数据不同，训练数据不同，使用的语言模型不同，测试的词汇量也不同。所以都各称业界第一，大家莫衷一是。

而每个大公司都有自己的商业需求，比如说在语音识别方面，当年做打字机的IBM想做语音打字机，垄断美国电信的AT&T要求贝尔实验室识别电话号码，所以大公司并没有动力来帮助小公司或学校。而小公司和学校，往往只有资源做些较小的数据集，结果通常也不如大公司的好。

不仅如此，数据不标准对AI研究而言是致命的，最后导致很多问题，包括：

1、因为测试语料库不同，最后识别结果，大家无法复制，也无法验证。彼此不认可，而且因为数据没有打通，算法就更不可能打通了。

2、因为每家做的领域不同，最后的结果都不可比。有些领域词汇量小，比较容易，但是做出结果也可能不能通用。有些领域词汇量大，但是约束很多，所以能说的内容不多，导致比较容易识别，也不能通用。

3、因为每家训练集不一样大，而训练集越大，一般结果越好。所以，有可能结果做的好，被认为并不是靠算法，而是靠数据量大。(责任编辑：方向)

“扫一扫”关注融合网微信号

免责声明：我方仅为合法的第三方企业注册用户所发布的内容提供存储空间，融合网不对其发布的内容提供任何形式的保证：不保证内容满足您的要求，不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网，融合网不承担任何法律责任。

第三方企业注册用户在融合网发布的内容（包含但不限于融合网目前各产品功能里的内容）仅表明其第三方企业注册用户的立场和观点，并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息，并不代表本网站的观点和立场，更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点，与本网站立场无关，不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断，自行决定并承担相应风险。

根据相关协议内容，第三方企业注册用户已知悉自身作为内容的发布者，需自行对所发表内容（如，字体、图片、文章内容等）负责，因所发表内容（如，字体、图片、文章内容等）等所引发的一切纠纷均由该内容的发布者（即，第三方企业注册用户）承担全部法律及连带责任。融合网不承担任何法律及连带责任。

第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容（如，字体、图片、文章内容等），经相关版权方、权利方等提供初步证据，融合网有权先行予以删除，并保留移交司法机关查处的权利。参照相应司法机关的查处结果，融合网对于第三方企业用户所发布内容的处置具有最终决定权。

个人或单位如认为第三方企业注册用户在融合网上发布的内容（如，字体、图片、文章内容等）存在侵犯自身合法权益的，应准备好具有法律效应的证明材料，及时与融合网取得联系，以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。

融合网联系方式：（一）、电话：（010）57722280；（二）、电子邮箱：2029555353@qq.com dwrh@dwrh.net

对免责声明的解释、修改及更新权均属于融合网所有。