百度进军人工智能领域 AI开放生态战略刚起步
从千夫所指到创新模范,百度只用了一年的时间,而秘诀就是大谈AI。不过,以此为始,百度也走上了一条只许成功不许失败的“不归路”。
本月初的百度AI开发者大会,并没有太多能让人“wow”一声的东西。但是,它至少郑而重之地给百度贴上了一个新标签——“人工智能公司”。
而且,从百度在开发者大会上重点介绍的Apollo和DuerOS开放平台的动作来看,它显然想做人工智能时代的领军者,而工具就是“AI开放生态战略”。用百度总裁陆奇的话说,百度的未来将建立在与开发者共赢的基础上。开发者的成功,就是百度的成功,这是百度AI平台的核心价值观。
开放什么?唤醒万物的DuerOS
如今,一个以安卓为操作系统主体的移动互联网世界已经形成。而百度度秘事业部总经理景鲲的话掷地有声:DuerOS要做AI时代的安卓。
“最好的搭建生态的方式就是开源。并且确实只有像百度这样的大公司才玩得起。”对百度的战略选择,赛迪顾问电子信息产业研究中心高级咨询师向阳这样评价。
DuerOS是一款对话式人工智能系统。在7月5日的“百度AI开发者大会”现场,百度的工程师展示了“让音箱学会汉语需要几步”。他用17行代码、1分钟时间,让搭载了Alexa系统的Anker音箱,从地地道道的外国货变成听得懂且说得好中国话的本地娃。
顺便说一句,Alexa也被媒体冠以过“AI时代的安卓”封号。
DuerOS的核心理念是“唤醒万物”,让设备和人之间能用自然语言沟通,让设备听得懂用户说话,懂用户需求。是的,这个设备可以是任何东西。而唤醒万物的核心要素,就是“听清、听懂、满足”。
在对话式人工智能分论坛上,百度演示了一段“花式折磨”智能音箱的桥段:我要听首安静抒情的歌!哎呀,不喜欢这首,换一首!算了,来首周杰伦的歌吧!不,再换一首!呀,这首歌叫什么名字?……
百度语音识别率达到97%以上,它的Deep Speech是2016年MIT十大突破性技术之一。“只做好这些还不够,人工智能时代要与场景结合,放在家庭小房间里,放在车上,让技术真正放在场景里解决问题。所以我们研发了远场相关的语音技术包括麦克风阵列、回声消除、波束成形、语音唤醒、远场识别。”景鲲说。
百度更大的优势,在于数据。
百度度秘事业部首席技术官朱凯华介绍,百度拥有中文世界最大的知识图谱,而且每天通过用户的搜索和使用,这个知识图谱还在呼吸和生长——吸收新知识,吐出过气知识。加上自然语言处理、多轮对话技术、深度学习的实践和搜索技术这些能力,DuerOS可以听懂用户的“freestyle”。如果你需要一家合心意的餐厅,可以尽情地在提问前加上一串定语:有没有环境优雅的适合情侣约会的在上地附近的人均消费两百元左右的餐厅?
怎么开放?全方位服务开发者
既然是做AI时代的安卓,就得开放。既然是“开发者”大会,开发者怎么玩自然是重头戏。
开发者怎么开发技能?这就需要讲到DuerOS的重要的技能框架。技能框架定义了第三方开发者如何为DuerOS开发技能。“DuerOS对话服务支持多种终端能力。不管合作伙伴提供什么样的硬件,通过DuerOS的对话服务,我们都可以为你提供最贴近硬件、最能发挥你硬件所长的智能服务。”朱凯华说。
同时,小度技能工具箱还可以提供工具,对开发者的应用开发提供帮助。它支持标准化接口,第三方开发者一行代码都不需要编写,就能创造标准化技能。如果百度提供的标准模板不能满足开发者的胃口,那么,百度还可以为其提供类似自然语言理解能力和对话管理能力这样的智能技能接入。“开发者不需要懂深度学习,不需要懂语音识别,就能让设备具有自如的语音沟通能力。”朱凯华表示。
DuerOS也是个智能设备开放平台。景鲲认为,AI时代,软硬结合是趋势。DuerOS提供最容易上手的软硬件一体化解决方案,它包括了多样化的开发套件和完全开放的参考设计。开发套件包括个人版、轻量版和标准版等。
“就像Windows有软件生态一样,DuerOS有技能生态。这个平台有比较好的开放性,也具备比较强的技术服务能力。”AI公司三角兽技术负责人陈华荣说,“我们公司和DuerOS合作,可以充分释放我们在AI方面的潜力,而因为DuerOS在各行各业都被应用,接入这一平台,我们所有的服务和解决方案,都可以马上获得更多场景和更多用户。”
目前,需要开发者的百度,还是要抱住开发者的大腿。在开发者大会上,他们请来了海信,请来了中信国安,请来了喜马拉雅,用合作方的口碑力证自家平台的能力。不过,也正如同一些分析人士所指出的,一旦生态建成,地位或将颠倒。
建立帝国?群雄逐鹿才刚开始
“从严格意义上讲,DuerOS不能算是人工智能时代的操作系统。”北京邮电大学人机交互与认知工程实验室主任刘伟告诉科技日报记者,“坦白说,别说国内,就是国外的谷歌、IBM的操作系统,也远没有成熟。”在刘伟看来,把DuerOS叫成“操作系统”,是一种商业炒作。向阳也认为,DuerOS其实更像一个嵌入式软件包。
语音交互是目前比较流行的人机交互模式,随着深度学习的“加持”,语音识别发展到了一个新的阶段。相比其他交互方式,语音交互在技术上确实相对成熟。“语音时代的到来,是比较自然的事情。”刘伟说。所以,也无怪乎国内外的科技公司,都瞄准了语音。他同时也指出,语音交互目前的难点,是语义和语用问题,这些问题并没有完全解决。
在“语音”领域,目前也是群雄逐鹿。能叫的出名字的,就有科大讯飞、思必驰、云之声等等。“在技术上,百度并不明显具有优势。其实,这几家技术差别都不大。”向阳分析,生态能否建成,恐怕关键还要看商业策略和推广力度。“还有一个重要的影响因素就是芯片。”今年3月底,百度联合数家公司发布了DuerOS智慧芯片,围绕成本、性能和易用性等方面打造一站式智能语音交互解决方案。在底层上的发力,可以为整个生态环境的构建打好地基。
向阳认为,DuerOS的开放,有望推动更多智能硬件产品的发布。毕竟,百度是个大公司,技术上领先,在平台上的投入也不菲,在平台的背后,还有庞大的运维团队支撑。“如果百度服务好,能够提供的功能模块多,作为一个中小企业,它当然会选择百度。”
车联网公司博泰创始人应宜伦说得铁板钉钉:移动互联网和人工智能,根本就是两个时代。“虽然比赛刚刚开始,输赢已经决定。我认为百度DuerOS相对其他,是个降维打击。”
其实,所谓的“降维”打击能不能成,关键要看开发者和合作者买不买账。正如景鲲所强调,希望DuerOS作为百度核心人工智能开放平台之一,真正开放赋能,推动时代的变革。“赋能我们的合作伙伴,赋能内容商,赋能芯片商、赋能整个生态。”