王海峰:始终把握语言与知识布局
8月25日,在百度大脑语言与知识技术峰会上,百度首席技术官王海峰说:"在百度语言知识技术的布局和发展中,我们一直注意把握两种趋势,即技术发展趋势和产业发展趋势,努力引领这一趋势。
自然语言理解(NLP)被称为"人工智能皇冠上的明珠",这意味着语言和知识等认知层面的技术突破将进一步推动人工智能的深入发展。王海峰充分分享了百度语言知识和技术的完整布局和最新成果。
首先,知识图是世界机器认知的重要基础。百度创造了世界上最大的知识图,拥有超过50亿个实体和5500亿个事实,并且在不断地进化和更新。百度知识图被应用于各个行业,每天有超过400亿次调用。
其次,在知识整合的基础上,语言理解能力不断提高。2019年3月,百度提出了知识增强的语义理解框架Ernie,它整合了基于深度学习的知识,具有持续学习的能力,一举跃居全球权威数据集的榜首,首次突破90大关,刷新了列表的历史。基于知识图形和语义表示、阅读理解、对话理解和跨模态深度语义理解被突破。
最后,语言生成是语言和知识技术的一个重要组成部分,基于预训练技术的成功经验,百度提出了一种基于多流程机制的语言生成预训练技术,该技术考虑了词、短语等不同粒度的语义信息,大大提高了生成效果,百度还探索了多文档摘要的生成,通过图形结构的语义表示引入文本知识,提高了单个文档和多文档文档摘要的生成效果。
展望未来语言和知识技术的发展趋势,王海峰说,仍然有许多技术问题有待研究和解决,如复杂的知识表示和快速构建技术,知识与深度学习的进一步整合,深度融合感知和认知的跨模式语义理解技术,模型的可解释性和鲁棒性等。