李开复:从1983到2017,我的幸运与遗憾

  • 时间:
  • 浏览:0
  • 来源:五分快乐8登入网址-五分快乐8官网

  文/李开复

  1

  今天跟当当我门 当当我门 讲个故事。

  1983-1988年,我正在卡内基·梅隆大学读计算机博士。

  我正忙着暑期教书,秋天投身奥赛罗人机博弈(黑白棋游戏,那是机器第一次真正意义上打败人类冠军的比赛)。

  我的导师瑞迪教授(Raj Reddy,图灵奖得主、卡内基梅隆大学计算机系终身教授、美国工程院院士)从美国国防部得到了60 万美元的经费,用来做不指定语者、大词库、连续性的语音识别。

  也可是说,他希望机器能听懂任何人的声音,或者 上能 懂上千个词汇,懂当当我门 当当我门 自然连续说出的每的话。

  这名个问提全是当时无解的问提。

  而瑞迪教授大胆地搞懂项目,希望同時 处里这名个问提。他在全美招聘了60 多位教授、研究员、语音学家、学生、程序运行员,以启动这名有史以来最大的语音项目。

  我也在这60 人名单之内。

  当时的科研背景是,业界或者 有类式今天高度学习的算法,但一个多多劲不难 实现数据标准化,数据量可是足够大。

  美国几大语音识别实验室(如MIT、 CMU、 SRI、 IBM、贝尔实验室)全是各用各的数据库,测试数据不同,训练数据不同,使用的语言模型不同,测试的词汇量可是同。可是都各称业界第一,当当我门 当当我门 莫衷一是。

  而每个大公司全是我本人的商业需求,比如说在语音识别方面,当年做打字机的IBM想做语音打字机,垄断美国电信的AT&T要求贝尔实验室识别电话号码,可是大公司并不难 动力来帮助小公司或学校。而小公司和学校,往往不难 资源做些较小的数据集,结果通常可是如大公司的好。

  不仅不难 ,数据不标准对AI研究而言是致命的,最后由于可是问提,包括:

  1、或者 测试语料库不同,最后识别结果,当当我门 当当我门 无法群克隆,也无法验证。彼此不认可,或者 或者 数据不难 打通,算法就更不或者 打通了。

  2、或者 每家做的领域不同,最后的结果全是可比。这名领域词汇量小,比较容易,或者 做出结果也或者 不难 通用。这名领域词汇量大,或者 约束可是,可是能说的内容不难 来太久,由于比较容易识别,可是能通用。

  3、或者 每家训练集不一样大,而训练集越大,一般结果越好。可是,有或者 结果做的好,被认为并全是靠算法,可是靠数据量大。

  4、对于学术单位来说,最大的问提来自于不难 足够的资源(可是难 兴趣)分类分类整理、清洗、标注大量的语料。对于小公司来说,语料和计算力全是问提。

  最后,瑞迪教授计划采用“专家系统”来完成项目,或者 这名措施须要的数据有限。

  专家系统是早期人工智能的一个多多重要分支,我应该 把它看作是一类具有专门知识和经验的计算机智能程序运行系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家有利于处里的僵化 问提。

  但我不认同。

  2

  完后 参加过的奥赛罗的人机博弈,我要对统计概念有了充分的理解,我对瑞迪教授的研究措施产生动摇。

  我相信建立大型的数据库,或者 对大的语音数据库进行分类,有或者 处里专家系统不难 处里的问提。

  另外,在1985年,美国标准局 (NationalInstitute of Standards and Technology)也意识到数据不标准会影响科研进步。可是在语音识别问提上,标准局设定了标准的语音和语言的训练集、测试集。要求每个学校的每个团队都用同样的训练集来训练模型,上能 我本人调好系统参数,比赛最后一天当当我门 当当我门 拿到数据,有一天时间跑出结果,当当我门 当当我门 评比。

  我从这名标准数据集和测试看完或者 。

  再三思考后,我决定鼓足勇气,向瑞迪教授直接表达我的想法。我对瑞迪说:“假如有一天转投统计学,用统计学来处里这名‘不特定语者、大词汇、连续性语音识别’。”

  我以为瑞迪会这名失望,没想到他这名都不难 生气,他轻轻地问:“那统计措施如保处里这三大问提呢?”

  瑞迪教授耐心地听完我激情的回答后,用他那永远温和的声音我可是知道:“开复,你对专家系统和统计的观点,我是不同意的,或者 我要支持你用统计的措施去做,或者 我相信科学不难 绝对的对错,当当我门 当当我门 全是平等的。或者 ,我更相信一个多多有激情的人是或者 找到更好的处里方案的。”

  那一刻,我的感动无以伦比。或者 对一个多多教授来说,学生要用我本人的措施作出一个多多与他唱反调的研究。教授不但不难 动怒,还给予充分的支持,这在可是地方是不可想象的。

  统计学须要大数据库,当当我门 当当我门 如保有利于建立起大的数据库呢?

  瑞迪教授看完我愁眉不展的样子,再一次给了我支持。你说什么,“开复,确实说我还是对你的研究措施有所保留,或者 ,在科学的领域里,确实也无所谓老师和学生的区别,当当我门 当当我门 全是面临这名个问提的攻克者,可是,我应该 真的须要数据库,不难 ,我要去说服政府帮你建立一个多多大的数据库吧!”

  瑞迪教授可是说服了美国政府部门和美国标准局分类分类整理并提供了大量数据。我用美国标准局提供的标准大数据,跟多家拿国家钱的机构数据,可是这名不拿国家钱的单位(如:IBM,AT&T)也参与进来,我可使用的数据越滚越大。

  除了大数据,统计学的措施还须要非常快的机器,瑞迪教授又我要购买了最新的Sun 4机器。此后每次有新的机器,他总要说:“先问问开复要从不。” 做论文的两年多,我为宜花了他几十万美元的经费。

  瑞迪教授的宽容再次我要感觉到这名伟大的力量,这是这名自由和信任的力量。

  3

  在导师的支持下,我开使了疯狂的科研工作。

  当时,我带着另一位学生同時 用统计的措施做语音识别。同時 ,这名60 多人用专家系统做同样的问提。从措施上来说,当当我门 当当我门 在竞争,或者 在瑞迪教授的领导下,当当我门 当当我门 分享一切,当当我门 当当我门 用同样的样本训练和测试。

  在1986年底,我的统计系统和当当我门 当当我门 的专家系统达到了为宜一样的水平,40%的辨认率。这确实还是完整不难 用的系统,但毕竟是学术界第一次尝试不难 难的问提,当当我门 当当我门 还是比较欣喜和乐观的。

  1987年5月,当当我门 当当我门 大幅度地提升了训练的数据库,采用了新的建模措施,不但有利于用统计学的措施学习每一个多多音,或者 上能 用统计学的措施学习每一个多多音之间的转折。针对这名音的样本不足,我又想出了这名措施(generalized triphones)来合并这名的音。这三项工作居然把机器的语音识别率从一个多多的40%提高到了60 %!可是又提高到96%。

  统计学的措施用于语音识别初步被验证是正确的方向。

  当当我门 当当我门 当当我门 相信了我用的机器学习措施和隐马可夫模型算法,或者 选择选择离开了不可行的专家系统(专家系统只达到60 %的识别率)。在我的博士论文基础上,可是的Nuance,微软、苹果苹果苹果机等公司做出了业界最领先的产品。

  1988年4月,我受邀到纽约参加一年一度的世界语音学术会议,发表学术论文。

  这名成果撼动了整个学术领域。这是当时计算机领域里最顶尖的科学成果。

  语音识别率大幅度提高,让全世界语音研究领域闪烁出一道希望的光芒,从此,所有以专家系统研究语音识别的人完整转向了统计措施。

  会后,《纽约时报》派记者JohnMarkoff来到匹兹堡对我作了采访,文章发表于1988年7月6日,占了科技版首页的整个半版。在这篇文章里,马可奥夫大力报道了我的论文的突破。当时,我只确确实和一个多多和蔼可亲的记者聊天,事后,我才知道这是一名才华横溢的著名记者,三次提名普利策奖,并在斯坦福兼教。

这是1988年,《纽约时报》对我博士论文的报道

  可是,《商业周刊》把我的发明家 选为1988年最重要的发明家 。年仅26岁初出茅庐的我,第一次亮相就获得一个多多的成功,我要感到很幸运,也我要有了继续向科技高峰攀爬的动力。

  而我也或者 拿到了卡内基·梅隆大学的计算机博士学位,这离我1983年入学不难 4年半的时间。在卡内基·梅隆大学的计算机学院,同学们平均6年以能有利于拿到博士学位,我用不难 短的时间拿到博士学位,是一项新的纪录。

  我也或者 破格留校,成为一名26岁的助理教授。

  4

  遗憾的是,确实我找到了方向和基本措施,但以当时的数据量级和计算水平,语音AI研究不难 有商业化或者 。我最终还是选择离开科研界,进入商界,用产品改变世界。

  60 年过了,AI发展的土壤终于肥沃起来。

  伴随互联网和移动互联网而来的大数据、高效的计算机运算能力等条件都齐备了。科研人员须要的数据集不再不难 难以触碰,可是须要有人牵头让更多的公司参与进来。这在60 多年前,我还是一个多多AI科研人员的时代,能接触到真实世界里不难 海量的数据,是个遥不可及的梦想。

  我当年受惠于瑞迪教授的帮助和指导,今天也非常希望能给更多和我一样的年轻人,创造研究或者 和条件。

  可是,昨天创新工场、搜狗、今日头条联合发起“AI Challenger 全球AI挑战赛”。三家公司分别投入大量资金、也搞懂千万量级高质量开放数据集与宝贵GPU资源。

  同時 ,我也倡导商界和科研界能采用大量的数据和标准的测试措施,也欢迎更多的数据公司有利于参与到这名平台里。

  希望当当我门 当当我门 推出的Challenger.ai,上能 帮助到中国AI人才成长。

  在我看来,这次AIChallenger绝对不可是一个多多活动,也绝对不可是一个多多奖金60 万、年底就开使的竞赛,这是推进中国AI人才成长的重大催化剂。

  希望3年或5年后,当当我门 当当我门 再来回顾这名段旧时空,当当我门 当当我门 发现中美AI人才之间不难 落差了,还能想到AI Challenger在一个多多重大过程中扮演了一个多多小小角,我应该 感到这名切全是价值。

  欢迎当当我门 当当我门 登录大赛官网Challenger.ai,获取信息并报名。关于这场大赛的具体信息可点击文末的链接了解(要在电脑页面能有利于报名哦)。

  当当我门 当当我门 或者 无法想象,我有多么羡慕当当我门 当当我门 ,生活在数据爆炸的时代,有人提供数据和奖金池,让有才华的人一展拳脚。