您的位置：首页 >评测体验 >

百度世界2020大会NLP技术全面升级文心ERNIE加速启动产业落地

来源：网络整理 2020-09-15 16:44:00

语言与知识技术的相关研究进展，影响着人工智能理解世界的方式。9月15日，一年一度的科技圈盛会百度世界2020大会于线上召开，总台央视主持人康辉，与百度创始人、董事长兼首席执行官(CEO)李彦宏的“虚拟人”在千万观众面前亮相，不仅动作自然、栩栩如生，更与真人进行多轮流畅交互，引发网友惊叹，满足了人们对未来时代“智能管家”的许多想象。

而为虚拟人理解世界、理解语言起到关键作用的，正是语言与知识技术。在当天下午举办的百度大脑分论坛上，来自百度的杰出架构师、文心(ERNIE)负责人孙宇登台演说，介绍知识增强语义理解框架文心(ERNIE)在语言理解、语言生成和跨模态语义理解等能力上的重大突破。此外，百度大脑提出了基于多流机制的预训练语言生成技术ERNIE-GEN和知识增强跨模态语义理解技术ERNIE-ViL，其中，ERNIE-ViL首次将场景图知识融入到跨模态的预训练模型中。孙宇还介绍，百度文心语义理解技术平台可为企业提供一整套NLP定制与应用能力，目前已累计支持2万余名开发者，覆盖金融、通信、教育、电商等行业。

百度杰出架构师、文心(ERNIE)负责人孙宇

语义理解核心技术升级，文心多项NLP技术全球领先

据了解，知识增强语义理解框架文心(ERNIE)于去年发布，大幅提升机器理解语言的水平，更在国际权威的通用语言理解评估基准 GLUE上首次突破 90大关，超越人类三个点，获得全球第一。文心的创新点在于，将大数据预训练与多源丰富知识相结合，持续学习海量文本中词汇、结构、语义等方面的知识，实现模型效果不断进化，如同人类持续学习一般。

分论坛上，孙宇介绍，百度文心语义理解技术包括基于预训练的语义表示、文章理解、文本匹配、文本生成等技术，以及可识别理解法律、金融文本的领域语义理解技术，并布局了跨模态、多语言、图理解等前沿技术，形成了涵盖基础、应用、领域、拓展四大层面的全景图。

在常识知识、多粒度语言知识、场景图知识等多源知识学习的支持下，文心语义理解能力、语言生成能力和多模态语义理解能力都得到了进一步提升和拓展。同时，基于海量数据，百度大脑构造了多粒度自编码任务和指代消解任务，推动文心在情感分析、文本分类、阅读理解等八项典型自然语言理解任务效果上获得进一步显著提升。

自然语言生成方面，文心提出了基于多流机制的预训练语言生成技术：ERNIE-GEN，在摘要生成、问题生成、多轮问答等自然语言生成任务上效果突出。同时，文心设计了多流注意力机制，融合逐词生成和逐片段生成学习目标，学习语言中多粒度知识后，全面刷新了语言生成任务的世界最好效果，在学术界和产业界具备非常大的研究价值与应用价值。

文心更在多模态语义理解上取得重大突破，视觉推理技术ERNIE-ViL可以通过物体识别体育运动图片中的运动场地及图中人物，进一步区分人员衣服颜色，根据知识判断穿出裁判和运动员的身份。理解细粒度语义的能力在这个推理的任务中发挥了关键的作用。ERNIE-ViL是业界首次将场景图知识融入到跨模态的预训练模型中，已广泛应用于工业场景。

能力平台化，百度大脑文心实现语义理解技术工业级应用落地

在人工智能技术落地的进程中，实际需求往往呈现出应用复杂、成本高企、耗时过长、可迭代性差等痛点。对此，文心语义理解技术平台应运而生。

孙宇介绍，文心平台基于领先的语义理解技术，可为企业提供一整套NLP定制与应用能力，让开发者更加简单高效地定制企业级NLP模型。在文心平台化服务中，提供了针对数据处理、模型训练、模型评估、模型部署等环节的“工具箱”，一站式满足开发者各类应用需求。此外，文心还提供了零门槛AI开发平台EasyDL和全功能AI开发平台BML两种平台支持方式。

一站式的NLP开发能力，既可以满足开发者的需求，也降低了定制开发的成本。在落地实践中，传统产品需要5100条数据标注以训练模型，而文心平均仅需220条，降低了90%的数据标注量。同时，文心通过预训练模型，降低了90%以上的算力投入，及86%的模型开发时长，周期从一周缩短为一天，这对企业开发者更加友好。

文心的另一大优势在于经过真实场景淬炼。据介绍，文心已应用于百度内部包括搜索引擎、推荐系统、智能音箱、智能客服等几十条产品线，其工业级应用能力已得到验证。目前，文心已经将NLP技术输送到金融、通信、教育、电商等行业，显著提升了这些企业智能应用的效果和效率。

作为“人工智能皇冠上的明珠”，NLP领域向来是人工智能技术研发与落地实践的前沿，在新基建的大潮下，也催生出大量自然语言处理方面的需求。从2010年百度成立自然语言处理部算起，在NLP从技术和产业上全面布局已经走过整整十个年头，不仅技术上形成先发优势，更完成了产业落地的绝对领先，致力于将AI技术下沉到千行万业，让人和机器互相理解的图景全面到来，造就更智能的未来时代。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

百度世界2020大会NLP技术全面升级 文心ERNIE加速启动产业落地

百度世界2020大会NLP技术全面升级文心ERNIE加速启动产业落地