17051255602
南京百度公司在历经上世纪几次起起落落后,2010 年代的人工智能(以下简称为「AI」)迎来一次前所未有的大爆发,从基础研究的众多突破到海量的场景应用,「AI 改变世界」已不再是一句口号,在 AI 持续助力人类抗疫的同时,无论是全球各行业日益增长的智能化产业升级需求,还是AI在生命科学、智能汽车、金融风控等领域的一系列落地应用,即将开始的「咆哮二十年代」里,AI 都在扮演重要角色。
作为中国最早将 AI 作为重要发展方向的公司,百度也在这场「 AI 大考」中拿出了一份漂亮的成绩单。
疫情期间,百度通过百度大脑平台与合作伙伴快速上线 AI 抗疫产品,保障复工复产;进入 2021 年,百度智能云提供我国首辆火星车「祝融号」虚拟数字人技术支持,未来将肩负科普太空知识、宣传中国火星探索进展的重任;在《互联网周刊》发布的 2020 年度 AI 企业百强榜单上,百度不仅在总分位居第一,还在细分的 AI 影响力、智能化维度处于领先地位。
另一方面,百度也在 AI 基础研究与专利领域取得诸多成果。公开资料显示,仅 2020 年,在业界权威的 CVPR、ACL、NeurIPS 等学术会议上,百度 AI 获得 30 多个冠军,还有 260 多篇论文被收录;根据国家工业信息安全发展研究中心等部门发布的《2020 人工智能中国专利技术分析报告》,在 AI 专利申请量和授权量方面,百度以 9364 件专利申请和 2682 件专利授权处于第一位,连续第三年位居第一。
如此亮眼的成绩的背后,离不开百度过去十一年对 AI 的持续技术与资金投入,特别是 2020 年,百度确定了全新的「云智一体」战略,并在架构层面打通云平台与 AI 平台之间的关系,实现「以云计算为基础,以人工智能为抓手,聚焦重要赛道」的战略目标。
一年后,百度 AI 的上述成绩以及基于百度 AI 的智能云业务同比 67% 的年度营收增长(2020 财年年化收入 130 亿人民币),进一步展现出该战略的正确性。从 AI 研究到 AI 赋能,从实验室的神经网络参数到各行各业通过 AI 获得真金白银,百度不仅展现出 AI 的巨大潜力,也向外界展现其 AI 领导力。
百度 AI 领导力密码之一:技术融合
不久前的博鳌亚洲论坛上,百度 CTO 王海峰分享了他对 AI 行业正在融合创新的观察,其中的一个融合领域是技术融合。换句话说,AI 已不再局限于之前「算法+算力+数据」的组合,而是向更深层次与更广泛的领域拓展。
比如向下与专属芯片的融合,百度推出了云端通用的百度昆仑芯片,相比于 Google、AWS 的 AI 专属芯片,昆仑芯片已完成与众多国产 CPU、国产操作系统的适配,更重要的一点,百度自主研发的昆仑芯片原生支持国内首个开源深度学习平台飞桨,这不仅使得百度 AI 具备软硬件一体能力,更为中国 AI 独立发展提供了软硬件支持,这在当下复杂的产业形势里至关重要。
根据公开资料,百度昆仑 1 代已实现万片以上的应用部署,在芯片权威的 Hotchips 大会上,百度昆仑团队的论文在 2020 年第四次被收录。而百度此前曾透露,昆仑 2 代芯片会采用 7nm 先进工艺,预计在 2021 年上半年量产,性能上,昆仑 2 代性能将提升 3 倍,还带有高速片间互联,以多款 AI 板卡型号来覆盖云训练、云推理以及边缘计算等场景。
另一方面,AI 的技术融合还呈现「深度学习+X」的特征,比如「知识图谱」就在与深度学习的融合中得以快速发展,基于知识图谱,计算机或者程序可以更好理解用户意图,由此带来的是计算机认知层面的大跨越。
百度目前拥有世界上最大规模的知识图谱,超过 50 亿实体和 5500 亿事实,除了基础的实体图谱,针对不同的应用场景和知识形态,构建了不同领域的知识图谱,例如事件图谱、多媒体图谱、行业图谱等。
与此同时,百度将知识引入到语义理解中,创新实现知识增强语义理解技术——文心(ERNIE),将大数据预训练与多元丰富知识相结合,通过持续学习技术,实现模型效果不断进化,在中英文多项任务上取得最好的效果。
举个例子,下面是「基于知识图谱的视频语义理解」的示意图,利用知识图谱,计算机或程序可以从左侧一张图片里「理解」并读取到一系列内容(右侧),这项技术可以应用于视频产品的多个场景里,极大提升了用户体验。
从纵向的专属芯片融合到横向的多技术融合,持续推动百度 AI 技术集大成者的百度大脑的进化,「AI 新型基础设施」的百度大脑,正在成为产业智能化的创新基座。
百度 AI 领导力密码之二:产业融合
AI 技术要实现各行各业的场景覆盖,除了底层技术的持续突破,还需要更友好或者更低的使用门槛,正如王海峰此前所言:「人工智能技术发展到今天,从科学研究的角度面临的问题越来越复杂,但从应用的角度实际上门槛在不断降低」。
AI 的下一步就是通过简单、便宜的 AI 开发/部署平台,让各行各业的开发者甚至业务人员都可以快速上线 AI 应用。
百度飞桨正是这样的一个平台。
自 2016 年正式开源以来,飞桨已经成长为我国首个自主研发、功能完备、开源开放的产业级深度学习平台。2021 年 3 月,随着飞桨发布 2.0 版本,成熟完备的动态图模式、全新升级的 API 体系以及业内首个通用异构参数服务器架构等一系列新特性,进一步提升了 AI 模型训练的效率,而根据此前飞桨平台透露的信息,WAVE SUMMIT 2021 深度学习开发者峰会已定档 5月 20 日,届时还将为飞桨带来更多新特性。
一方面,飞桨通过多种形式的培训渠道,为企业与学校的开发者提供培训、认证,截止到 2020 年底,飞桨开发者生态已经拥有 265 万开发者。另一方面,飞桨积极与硬件生态伙伴,特别是国产硬件厂商加快合作,目前已和 20 家生态伙伴合作适配了 29 种芯片或 IP。
更进一步,面对企业 AI 应用开发需求越来越强烈的行业现状,飞桨企业版应运而生,在开源版本功能的基础之上,提供了面向中小企业的 EasyDL 与适用于大型企业的 BML。
这其中,EasyDL 可以说是「零门槛的 AI 开发平台」,能够帮助企业实现从数据标注到模型部署等一整套 AI 模型开发部署流程,目前支持图像、文本、语音、OCR、视频、结构化数据等 6 大技术方向 15 种定制化类型,文本领域更是拥有由百度自研、业界领先的语义理解技术文心 ERNIE。
根据 IDC 公布的《深度学习框架和平台市场份额》报告,截至 2020 年 12 月,百度 EasyDL 已连续两年位居中国机器学习平台细分市场份额第一。已有超过 4 万多个用户在 EasyDL 上累计训练了近 10 万个模型,近 2 万个模型在不同环境下部署上线,并在零售、工业、安防、医疗、互联网、物流等 20 多个行业中落地应用。
百度 AI 产业融合的第三个层次则是把 AI 能力开放给各行各业。所谓「能力」,就是将一系列 AI 技术封装,通过抽象、统一、组件化的方式提供给企业,目前百度 AI 能力开放平台涵盖了语音、视觉、AR/VR、语言与知识四大 AI 技术方向能力,已经开放了 270 余项 AI 技术,形成业界最全面和最领先的 AI 开放能力集合。
2020 年百度又推出 AI 中台解决方案,旨在解决企业部署 AI 过程中的「烟囱化建设」、资源浪费和使用率低下的问题,目前,AI 中台解决方案已落地多家大企业客户,尤其在能源电力行业。
在历史悠久的云南丽江,基于百度 AI 打造的「丽江城市大脑」,拥有「1+1+4+N」的大脑架构,即 1 张神经感知网络,1 个城市智能云平台,4大中台(AI 中台、数据中台、感知中台、交互中台),N 个应用场景,为城市各领域业务应用提供数据支持和 AI 赋能。
在福建泉州,百度智能云将 AI 各项能力与水务行业需求相结合,与合作伙伴共同构建了智能的「水务大脑」,从全厂 AI 巡检到设备监控预警再到 AI 用水量预测模型,形成兼具效率与智能的水务管理「泉州模式」。
利用飞桨、AI 能力开发平台、AI 中台等一系列门槛更低也更友好的平台产品,百度构建起了一条将 AI 技术快速、稳定输出到产业的通道,成为百度 AI 赋能千行万业的重要布局。
百度 AI 领导力密码之三:引领技术发展趋势
作为一个持续且高速发展的领域,AI 的发展方向成为整个产业界关注的焦点,百度 AI 过去几年已经在某些领域形成引领态势。
比如坚定推进飞桨的开源开放。作为一个扎根中国、面向中国企业的深度学习开源平台,飞桨之于中国深度学习发展的意义不言而喻,中国需要属于自己的深度学习开源平台,也需要更多基于中国市场需求进行创新的企业开发者。飞桨的技术突破、服务生态以及落地能力,正在成为承载中国企业 AI 发展以及产业转型的舞台,也将使得中国在未来全球人工智能竞争中拥有不小的话语权。
在被誉为「AI 皇冠上的明珠」的自然语言处理领域,百度的语言生成预训练模型文心(ERNIE)开创性地将大数据预训练与多元丰富知识相结合,通过持续学习技术,实现模型效果不断进化,可以在16 个中英文典型 NLP 任务上显著超越当时世界最好效果。
2020 年世界人工智能大会上,文心摘得最高荣誉 SAIL 奖(Super AI Leader,卓越人工智能引领者)。基于 ERNIE 语言模型的语言识别模型获得 INTERSPEECH 2020 阿尔茨海默症早期诊断冠军。2021 年 3 月,文心再次登上了 GLUE(通用语言理解评估基准)的榜首。
与此同时,百度还在探索量子计算、生物计算等前沿技术的应用。其中,量子计算已正式发布包括「量易伏、量桨、量脉」三大核心项目的百度量子平台,围绕其开展量子技术储备、量子人才培养以及量子生态构建,推动整个行业的发展。
面向生物计算,百度发布的 PaddleHelix 螺旋桨生物计算框架,提供了包括 RNA 二级结构预测、大规模的分子预训练、药物-靶点亲和力预测以及 ADMET 成药性预测等算法和模型。重点满足疫苗设计、新药研发、精准医疗的 AI 需求,该项目也在国际权威榜单 OGB 两项分子性质预测任务中登顶,展现 AI 药物发现领域取得新的技术突破。
事实上,上述这些新学科或新领域已呈现高度交叉的态势,都需要底层强大的计算能力与算法、数据做支撑,而这些也是百度在 AI 领域的技术积累,百度创始人、董事长兼首席执行官李彦宏前几天的一番话,对「AI+生物计算」的前景做了解读:「依靠生物计算引擎,能够有效利用大量的生物数据,能够把所有的尝试积累到统一的知识图谱之上,从而把药物发现的『大海捞针』变成『按图索骥』,加速发现 First-in-Class 的创新药物,为人类的生命健康谋福祉」。
写在最后:技术的星辰大海永无止境
AI 作为一项全新的通用技术,正在成为社会经济发展的新「燃料」,特别是在疫情与复杂的国际形势面前,AI 就是中国持续自主发展的重要技术支撑。
这是对百度在内的中国众多 AI 公司的重要历史发展机遇,集百度 AI 之大成的百度大脑进化到 6.0,新的 AI 基础设施将进一步增强百度在 AI 技术与产业融合层面的竞争力,而百度在量子计算、生物计算等一系列前沿领域的投入,也会持续放大百度 AI 的行业领导力,这趟技术的星辰大海之旅永无止境。
17051255602