百度人工智能怎么样?

网友解答: 百度总部的每一栋大楼的每一层电梯旁的电视里都循环播放着百度在人工智能方向取得的很多进展,说真的,每次看都觉得热血沸腾,为自己能是这样一家有未来感的公司的一员而骄傲。但是,作为

网友解答:

百度总部的每一栋大楼的每一层电梯旁的电视里都循环播放着百度在人工智能方向取得的很多进展,说真的,每次看都觉得热血沸腾,为自己能是这样一家有未来感的公司的一员而骄傲。但是,作为员工,我其实一直很好奇,这么好的宣传片,为什么百度不对外播放呢?

我想通过几个可能只有百度员工知道的故事,来向大家介绍百度的人工智能发展吧。

宝贝回家

百度有一个项目叫做宝贝回家,是通过人脸识别能力,分析走失儿童的童年照片特征,然后在海量的照片中进行匹配,最终帮助父母找到自己走丢的孩子。值得注意的是,寻亲成功的时间跨度从8个月到27年不等,也就是说,不仅可以找回刚刚走丢的孩子,还可以仅仅通过童年照片,就在无数的成年人的照片中找到走失者,这是怎样一种强大的能力啊。

这样的项目帮助了数不清的孩子回家了,但是百度从来没有为这项公益事业而大张旗鼓的宣传。

有一天,内网上有个PM发帖,说一对老夫妻联系他,他们的孩子由于“宝贝回家”计划找到了自己丢失了十多年的孩子,他们特别感谢百度,想来想去就采了家里结的最好的苹果,装了两大箱,希望能够送给百度的同事们,表达自己的谢意。这对夫妻非常淳朴,为了表达谢意专门带着两箱苹果从周边城市坐火车赶过来,也不知道任何人的联系方式,就摸索着到了百度的办公区,多亏了保安大叔帮忙,才联系到了一个PM。

说实话,如果不是PM发帖,我们作为百度员工都不知道还有这么感人的故事。

自动驾驶

百度的自动驾驶一直是对外介绍比较多的一项,李彦宏曾经坐着无人驾驶的汽车上北京二环的新闻当时也算轰动一时,虽然后来被眼尖的网友发现压了实线,哈哈哈。百度内部是有个无人驾驶车队的,现在肯定还未上路,但是说明百度在自动驾驶方面的布局已经很广了。

除此之外,百度还有人工智能翻译,视觉辅助(针对盲人),宠物脸识别等等解决方案,篇幅有限,不多赘述,有兴趣的朋友欢迎关注我,我会每天分享科技类见闻。

网友解答:

要谈百度的人工智能布局就要追溯到它成立之初。

18年前,百度作为搜索公司诞生。当时的搜索引擎还是一个基于统计学的技术,但随着互联网的快速发展,在千奇百怪的用户需求和海量数据处理要求下,搜索引擎变得越来越依赖人工智能和机器学习技术。

于是,2010年百度开始全面布局包括语音识别、自然语言处理、机器学习、知识图谱、视觉语义等在内的人工智能技术。并在两年后着手深度学习技术的研发,将其用在百度图像、语音等具体应用中。

鉴于深度学习技术在实际应用中的惊艳表现,2013年百度正式成立了深度学习研究院IDL(Institute of Deep Learning),诸多知名专家纷纷加入,为其人工智能技术的完善和提升不断加持。除了在国内,在美国硅谷离苹果公司不远的地方也设有百度深度学习实验室。基于此,百度在全球率先将深度学习技术应用于大规模线上搜索引擎,还基于深度神经网络上线了机器翻译系统。

就这样,经过了长达16年一步步的技术积累和投入,百度大脑在2016年正式在百度世界大会上推出。如今,它已经拥有万亿级的参数、千亿样本、千亿特征训练,甚至能模拟人脑的工作机制。从基础层、感知层到认知层和平台层,不仅能够对内提供完整的人工智能技术支持,同时,百度还在去年7月宣布对外开放了包括语音识别、理解与交互技术UNIT、人脸识别等核心AI能力,以及深度学习平台 PaddlePaddle。

百度大脑基础架构

两年来,从1.0版本的基础能力搭建到2.0形成了完整的技术体系,首次开放60多项AI核心能力,再到此次3.0版本的发布,百度大脑的能力仍在不断提升。

具体来说,百度大脑3.0的发布包含了技术升级、开放升级两大层面。技术层面,百度大脑3.0在业界首次提出“多模态深度语义理解”,并形成从芯片到深度学习框架、平台、生态的AI全栈技术布局;开放层面,百度AI开放平台持续升级,是最完整、最前沿、最开放、最具活力的AI技术平台。

百度大脑3.0:聚焦“多模态深度语义理解”

在日前的百度AI开发者大会上,百度正式发布了百度大脑3.0版本,其核心是“多模态深度语义理解”,具体是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

换句话说,就是要能让机器听清、看清,从而深入理解语义背后的含义,深度理解真实世界,更好地支撑各种应用。而其中,百度地图语音助手就是语音语义一体化和自然语言处理技术结合最典型的应用场景之一。

王海峰介绍,如今百度高噪声环境Hand-free语音识别准确率已提升了10个百分点,语音语义一体化技术使得远场语音识别准确率提升了10个百分点;在语音合成方面,WaveNet+拼接的情感语音合成技术,使得流畅度和自然度也大幅提升。

此外,他还以对话理解和阅读理解为例,介绍了百度的自然语言理解技术。事实上,百度的对话理解技术已经积累多年,而百度大脑3.0版本中通过研发最新的深层注意力匹配模型,比已知的最好结果又提升了4.1%。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识。

更有趣的是,借助视觉的语义化技术,百度大脑还被应用在了世界杯的视频解析场景中。大会现场,王海峰播放了一段世界杯球赛视频,视频中,百度大脑可以通过识别视频中的裁判、球、球门、球场线等,捕捉射门、进球、角球、换人等画面,完成机器人解说、精彩片段集锦剪辑、以及数据统计分析等等。

知识是机器理解世界的重要基础,为此,在多元语义知识方面,百度也构建了包含数亿实体、数千亿级事实的庞大知识图谱。除了基础的由实体、属性、关系构成的实体图谱,还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。所有这些,都构成了百度大脑的基础。

“通过持续获取和积累知识,百度大脑的理解能力和智能水平还会不断升级,从而更好地服务于用户。”王海峰说。

必须强调的是,在百度大脑3.0“多模态深度语义理解”技术突破的背后,深度学习平台PaddlePaddle发挥了重要作用。大会上,王海峰正式公布了PaddlePaddle3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取AI能力的平台。而作为本次大会发布亮点之一的AI芯片“昆仑”也将与PaddlePaddle深度学习框架深度结合,从而推动AI行业生态的快速发展。

总的来说,百度在人工智能领域正在扮演的是一个“授人以渔”的角色。它不仅正在通过AI开放平台让每个人平等地使用AI技术,与此同时还集众开发者之力持续为百度大脑的迭代和升级赋能。除此之外,借助百度AI生态伙伴“燎原计划”、AI加速器等方式,百度也在不断打造和布局自己的生态系统,从而为开发者释放更多价值,为产业升级带来了更多想象力。

标签: