海南新闻网

2019世界人工智能大会 百度吴甜揭示语言与知识技术进化路径

9月1日的中新电子语言是机器与人类联系的重要途径。知识是机器深入了解现实世界的必要条件。 8月31日,世界人工智能会议(WAI)2019年在开发者日在上海举行。百度人工智能技术平台系统执行总监吴田应邀出席并揭示了百度语言和知识技术在人工智能产业化方面的新进展和突破。

“自然语言理解是人工智能领域最具挑战性的问题之一,”吴说。面对工业开发商的技术征服,我们应该关注实际场景中的问题的沉淀和总结,不断提高技术的需求,以通过创新来迎接未来。

建立语言和知识技术平台,准确应对行业需求

演讲开始时,吴天向客人展示了百度AI同声传译与百度地图之间语音交互的实际案例,并表示1964年《机器翻译浅说》的未来已经实现。无论在舞台上哪个国家的演讲者,舞台上的人都可以通过耳机听他们的母语。百度在语言和知识技术领域的惊喜远不止这些。目前,百度的语言和知识技术可以通过布局智能搜索,深入问答,对话系统,智能写作,机器翻译等场景,使用户在日常使用中感受到语言和知识技术的便利性。

如今,工业开发人员不再需要单一的技术,他们需要优秀的应用效果,高效的研发效率,灵活的服务部署,并能在相应的场景中有效地登陆AI技术,这与百度脑语言和知识技术平台开放的初衷相吻合。为此,百度脑语言和知识技术开放平台不断降低技术使用门槛,建立了桨技术支持,包括语言和知识基础技术层,应用平台层,服务模式,场景方案等。以便前线行业开发人员可以使用AI工具快速关联。技术在应用场景中布局。

百度化身技术“先行者”语言和知识技术贯穿全过程

作为机器理解人类意图的最重要技术之一,语言和知识技术是国内外技术巨头的战场。百度多年来一直在培养语言和知识技术,并且站在巴别塔的更高层次。

2019年,百度发布了ERNIE 2.0,一个可持续学习语义理解框架,以实现持续学习的新突破。在引入新任务时,框架可以学习任务,同时不会忘记之前学过的信息。目前,ERNIE在16项中英文任务中超越了BERT和XLNet,实现了SOTA效果。除了在学术领域的价值之外,ERNIE 2.0还具有不容忽视的工业价值。特别是在当前的国际贸易和技术背景下,ERNIE 2.0所代表的无人监督的预训练语言模型处于非常关键的工业位置。

此外,ERNIE还获得了深度学习平台PaddlePaddle的潜在祝福。在GPU多级多卡培训中,基于ERNIE模型的飞桨训练的多机加速比为77%,远高于其他主流实施。在加载预训练模型方面,飞桨预训练模型管理和迁移学习组件PaddleHub可以用一个按钮加载工业级预训练模型。使用PaddleHub组件,ERNIE语义表示模型可用于预测具有一行代码的预训练模型的预测以及具有10行代码的大规模预训练模型的迁移。

PaddleNLP是一种用于飞桨的自然语言处理模型库,是一种基于飞桨的工业级中文NLP开源工具集。它拥有业内最好的中文语义表示模型和基于数百亿大数据培训的预训练模型,可以大大减少用户。在开发过程中反复工作,以实现基于工业实践的更好的应用结果。

在应用级平台方面,吴天以UNIT(理解与交互技术)平台为例,分析了这些平台的智能性和便利性。智能客户服务,智能驾驶和其他场景对人机对话的流畅性和准确性进行了严峻考验。 UNIT平台致力于为对话系统创建专业,低成本,全链接的技术和服务平台。为金融和教育等行业提供解决方案和服务。

UNIT平台的核心技术包括三个部分:语义理解,阅读理解和对话管理。 ERNIE SLU在相同的理解精度下可以实现37%~72%的标记减少。 DataKit可以将数据生成效率提高8倍,并使用语义理解SLU。定制可以将对话技能的综合研发成本降低60%。目前,UNIT平台已实现68,000个定制技能,累计交互次数达570亿次,涵盖智能客户服务,智能旅游,智能办公等智能交互场景,为一线开发人员提供强大的工具实现人工智能产业化。

坚持创新“未来50年”,以满足语言和知识技术

“预言已经实现了50多年,它依靠技术上的突破和创新”,吴天认为,作为一种语言和知识技术,拥有30多种技术工具,灵活可定制的服务方式,全面的技术领先和更高的效率开放平台,百度应该继续为应用线提供创新的AI功能,实现真正的突破性创新,开源和开放,展望未来。

坚持创新和开放是百度在语言和知识技术领域的长期发展目标。近年来,百度不断在该领域取得技术突破,不断为开发人员及相关领域提供更好的技术支持,深化技术与应用的结合,将AI技术推向更多场景,加速工业化进程。情报。