互联网头部企业引领自然语言处理技术高质量发展

2021-10-18 14:10:00
提升计算机处理自然语言的能力,已经成为了未来人工智能技术研究的一大热点。

自然语言处理(Natural Language Processing,NLP)是将自然语言经过处理转化为机器所能识别的机器语言的理论和技术,是计算机科学和语言学的交叉学科,是人工智能重要研究方向之一。自然语言处理技术在人工智能发展中起到重要基础性支撑作用,是人工智能众多分支的共性技术,被喻为人工智能领域皇冠上的明珠。

从国家工业信息安全发展研究中心知识产权所(工信部电子知识产权中心)发布《2021中国人工智能高价值专利及创新驱动力分析报告》(简称报告)研究成果来看,互联网头部企业引领自然语言处理技术高质量发展。

就中国专利申请趋势而言,2001年至今,我国自然语言处理技术领域专利共有62180件,在人工智能技术受到密切关注的大背景下,自然语言处理技术专利呈现出指数型上涨态势。2001至2010年,自然语言处理技术的专利申请量增速较为平缓。在2011至2015年这一阶段,数据量的上涨、芯片算力的提升和深度学习算法的出现促进了自然语言处理技术的快速发展。鉴于自然语言处理的应用前景广阔,预期该领域技术研发和专利申请仍将保持高速增长的发展态势。

人工智能-自然语言处理图1 中国自然语言处理技术专利申请趋势分析

(受公开滞后影响,2021年专利数据不完整)

从中国自然语言处理技术主要创新主体的专利申请量和授权量排名来看,百度公司无论在申请量还是授权量均是排名第一,表明其在自然语言处理技术领域具有领先的技术研发创新和专利布局战略优势;申请量超过千件的创新主体还有腾讯,其授权量位列第二,积累了丰厚的自然语言处理技术基础;此外,科大讯飞虽申请量优势不明显,但授权率相对较高,其在自然语言处理技术领域的技术实力以及潜力不容小觑。在科研院所中,浙江大学、北京航空航天大学、清华大学以及中科院所排名进入前十,由此可见,我国自然语言处理技术基础研究实力也较强,国内高校和科研机构的自然语言处理技术创新活跃度较高,具有深厚的技术积累。

百度项目图表(自然语言处理)

图2 中国自然语言处理技术前十创新主体专利申请量和授权量排名

从依据本报告高价值专利评价模型的“创造力”、“保护力”、“运用力”、“竞争力”、“影响力”五大指标维度对自然语言处理技术的主要创新主体进行高价值专利及其创新驱动力的评价结果来看,互联网企业领跑了自然语言处理技术的发展。在自然语言处理技术创新主体高价值专利及创新驱动力排名中,百度排名第一,其次是微软、腾讯、阿里巴巴和平安科技。从技术应用来看,自然语言处理技术步入商业应用阶段。百度通过AI开放平台提供了文本纠错、情感倾向分析、评论观点抽取、对话情绪识别、新闻摘要等多类技术共享产品,基于飞桨平台自研的语义理解框架ERNIE2.0构建了持续学习语义理解框架,在中英文16个任务上具有业界领先优势。腾讯提供了关键词提取、自动摘要、智能闲聊、百科知识图谱查询、智能分词等服务。阿里巴巴提供了自然语言处理服务,商品评价解析、招投标解析、智能合同等自学习平台,医学实体识别、机器翻译、地址标准化等场景应用服务。微软提供的自然语言处理服务包括词性标注、分词、语言检测、自动文摘、自动问答等。

表 中国自然语言处理技术高价值专利及创新驱动力排名

近年来,随着技术的发展,人们意识到传统的基于句法-语义规则的理性主义方法太过复杂,基于统计的经验主义也只能有限地获取数据。而随着语料库的建设,大规模的语言数据处理成为了自然语言处理的主要发展趋势。与此同时,自然语言处理中利用机器自动学习来获取语言知识的方法也越来越广泛。另外,自然语言处理也越来越重视词汇的作用,并出现了“词汇主义”,词汇知识库的建立已经成为自然语言处理技术发展中的热点问题。目前,自然语言处理的研究领域已经从文字拓展到语音识别、句法分析、机器翻译、机器学习和信息检索等多个方面。提升计算机处理自然语言的能力,已经成为了未来人工智能技术研究的一大热点。

(图片来源丨网络)

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
评论区

    下一篇

    伴随百度、华为、小米以及谷歌、苹果等互联网科技公司纷纷布局,智能驾驶迎来产业发展的黄金时期,智能驾驶领域技术专利呈现快速增长态势。

    2021-10-18 14:00:00