11111111111

222222222222222

百度ai文心一言=百度ai文心一言在线(百度文心官网)

  

  Bloomberg的这篇文章告诉你,百度的计划到底是什么。

编译/陆瑶

原文/Bloomberg News

在中国,超过1300人正在从事诸如深度学习等科技行业。

  

图片来自:Simon Abranowicz

2016年12月6日,成千上百名译者涌进了中国大陆的政府办公大楼。他们细读各种外语编成的宣传手册、信件文书和科技指南的每行每字,使出浑身解数翻译成中文。这场翻译的马拉松每天长达15小时,要持续整整一个月。那些等着收到中文版材料的客户往往用相当便宜的价格就能收获这些专家级的翻译。但是组织这场大规模翻译的百度公司却将获得更有价值的东西:数以百万计的中英词对,用以训练其在线翻译引擎。

小到奢侈品手袋,大到互联网新创,中国一度因为山寨品而闻名中外。然而一旦谈及AI,中国的领导层却毫不含糊,他们清楚地知道当Alphabet、Facebook、IBM和微软都已经加入这场战争,廉价的模仿已经毫无用途。今年二月,中国国家发展与改革委员会正式批复由百度牵头筹建AI实验室,这意味着中国政府相信百度在AI领域可以称霸中国。

百度ai文心一言=百度ai文心一言在线

上个月,AI实验室正式投入使用时,实验室联合创始人及百度首席执行官李彦宏表示,在过去的两年半中,百度在各项研发中投入了200亿人民币(约29亿美元),其中大部分都在AI领域。不过,李彦宏在AI投资巨额的原动力当然不仅源于国家层面——百度2015年的收入增长下降到了6%,而在三年前,百度的年收入增长额度可以达到30%。截止至2015年12月31日的上一个财政年,百度的广告收入虽达到705亿人民币,但同行业的竞争对手不断涌现。调研公司EMarketer在去年九月发布的报告称,在互联网广告市场,阿里巴巴已超越百度成为市场第一巨头。显然,百度指望AI能助自己一臂之力夺回市场霸主地位,进一步吸引新的投资者。

  

已经成立17年的百度曾尝试发展多样化的互联网经济,引发的结果却喜忧参半,一言难以蔽之。截止2017年二月为止的前12个月内,百度旗下的团购网站糯米的日浏览量下降了59%;中国国际金融中心的分析师吴越分析,百度外卖的销售量已经下降到了第三位。根据华兴资本(香港)有限公司的分析师Ella Ji估计,百度合作的流媒体视频服务网站爱奇艺虽然极受欢迎,但今年仍需斥资120亿人民币才能保持其内容丰富。

这些岌岌可危的数据都指向百度进军AI的举措刻不容缓。“移动互联网的时代已经终结了,”在三月10日的一个访谈中,李彦宏表示,“我们将大力进军AI行业。个人看来,AI将会造福大众,也会促使行业相继转型。”

今年一月,微软前任执行官陆奇被任命为百度首席运营官,他将联手首席科学家吴恩达帮助百度公司研习诸如深度学习、扩增实境、图像识别等技术。吴恩达于2014年来到百度工作,之前,他作为斯坦福学者在Alphabet研究深度学习。在吴恩达的指导下,散布在北京、深圳、上海和加州森尼维耳市的百度AI实验室已经扩大到1300多人,预计在今年有望再增加几百人。“无论是在中国还是美国,大量的新产品都在被设计研发,”身处硅谷的吴恩达表示,“通过对这两个国家的观察,我们就能看到新的潮流趋势是什么。”

  

吴恩达

2014年五月,森尼维尔市的研究中心正式启动,吴恩达和他的首席助理亚当·科茨(Adam Coates)在一块崭新的白板上决定了他们的第一个项目。在罗列出他们即将面对的所有可能性与挑战后,他们决定以语音识别为起点,为将来的一系列其他项目打下根基。

2015年,吴恩达带领的50人团队研发出了能够识别大部分英语的语音识别系统Deep Speech。不同于以往的逐字机械识别,Deep Speech可以通过对于语言数据的语法分析,推测其句法和句意,而这正是深度学习的一种。吴恩达表示,相比较传统的依靠单词表和语音规则翻译的搜索引擎,Deep Speech更是对语言的一种转录。Deep Speech能够根据上下文推断每个单词的具体含义。

研发中,他们遭遇最大的问题就是英语中的外来词。“如果你对Deep Speech说‘播放柴可夫斯基的音乐’,它录入的可能是‘播放柴·克服·司机的音乐’,”科茨解释道,“所以我们把这个问题戏称为‘柴可夫斯基问题’。”

百度ai文心一言=百度ai文心一言在线

  

为了解决这一困难,百度的开发员们并非简单地在单词列表中增添“柴可夫斯基”一词草草了结,而是尝试教会Deep Speech系统理解这个单词。这就意味着他们必须投入更多精力,输入更多数据让系统本身学会识别上下文。

百度自然语言工程师赵世奇回忆起自己在中国哈尔滨工业大学学习计算机科学的年代,电脑翻译软件只有200万中英词对,而如今,百度翻译却有1亿对。不过根据《科学》杂志2016年刊登的文章中的数据,Alphabet已经拥有5亿中英词对,百度与之相比仍是小巫见大巫。

  

  Baidu Deep Mind

为缩小这一差距,百度想的解决办法似乎是老套路:投入大量人力资源。就像文章开始提到的那场翻译马拉松赛一样,百度定期聘请大量译员进行人工翻译,作为回报,百度会在每次翻译大会中分发智能手机或者净水器作为奖励。收集到的大数据不仅能提升百度翻译系统的性能,也能支持Deep Speech的进一步研发。

2016年六月,随着web语音翻译工具TalkType的发行,Deep Speech首次应用在商业用途中。此外,Deep Speech也进一步和其他产品进行合作,其中包括各类和Siri类似的语音助手,比如结合了“百度”和“秘书”两个词的人工智能秘书“度秘”。在世界其他地方,“度秘”的名字叫“度儿”,因为这一中文发音类似于英语中的“Doer”。百度开发的Deep Speech也逐渐和其他产品合作,开发人工智能。例如在今年一月美国拉斯维加斯举办的国际消费类电子展(CES)上,百度度秘和小鱼在家联手发布了新一代小鱼在家视频对讲机器人,成为亚马逊的对讲机器人Echo的有力竞争对手。

  

百度展示的“小鱼在家”(来源:百度图片)

百度拥有的一系列门户网站使公司清楚知道中国大部分用户的个人信息大数据,这在一定程度上也是百度进军AI产品和服务领域的优势。有了百度糯米和百度外卖,百度对于中国家庭的购物和饮食偏好了如指掌;有了世界第二大旅游网站携程,百度又进一步掌握了中国家庭最爱的旅游目的地。每个月,有6亿650万智能手机用户通过百度的移动终端或者app上网,有3亿410万用户使用百度地图导航。“纵观各个应用案例,我们不应该把AI理解成一种产品,而应该把它理解成产品背后的支持体系。”汇丰控股有限公司分析师Chi Tsang如是表示。

尽管百度的AI产品还未实现盈利,但这一努力可能帮助其在其他方面取得主导优势。在这些领域,百度已经拥有立足之地,同时在将其推向新的层次,比如云计算和无人驾驶汽车等领域。“三到五年内,这些领域都可能涌现另一个百度,”百度总裁张亚勤在谈及百度的602亿美元市值表示,“是时候下一个赌注了。”

  

Powered By Z-BlogPHP 1.7.4

Copyright Your WebSite.Some Rights Reserved.