基于构式语法理论和深度学习的中文文本复杂性分析
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Complexity Analysis of Chinese Text Based on the Construction Grammar Theory and Deep Learning
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
中文文本在开放关系抽取中的复杂性分析及深度学习提取系统构建。摘要:本研究基于构造语法理论,结合深度学习构建中文词向量抽取系统,在公共数据集上F1值达67%,优于同类算法,且在高召回率下准确率显著提升,为中文文本分析提供新思路。
摘要
由于中文的复杂性以及中文与英文之间的差异,中文文本在数字领域的应用存在一定的复杂性。以开放关系提取(ORE)中的中文文本为研究对象,分析了中文文本的复杂性。构建了一个基于构式语法理论和深度学习(DL)的词向量提取系统,以实现中文文本的顺利提取。本文的工作主要包括以下方面:首先,探讨了构式语法的内涵及其在中文文本分析中的作用;其次,从语言分析中词向量的角度出发,实现了一个基于词向量的ORE模型;此外,还提出了一种基于词向量距离的提取方法。测试结果表明,该算法在公共WEB-500和NYT-500数据集上的F1值为67%,优于其他类似的文本提取算法;当召回率超过30%时,该方法的准确率高于几种最新的语言分析系统。这表明,基于DL算法和构式语法理论的中文文本提取系统在复杂性分析方面具有优势,可以为中文文本分析提供新的研究思路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号