利用词法-句法模式和词嵌入自动构建区间值模糊印地语WordNet

《ACM Transactions on Asian and Low-Resource Language Information Processing》:Automatic Construction of Interval-Valued Fuzzy Hindi WordNet using Lexico-Syntactic Patterns and Word Embeddings

【字体: 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  本文提出了一种基于区间模糊图的印地语词网IVFHWN,通过词嵌入和词汇语法模式自动识别词间语义关系,解决了传统印地语词网手工构建和类型1模糊集的不确定性,实验表明IVFHWN在词义消歧任务中效果优于类型1模糊印地语词网和经典印地语词网。

  

摘要

计算词典是任何语言处理系统的核心。它通过向计算机灌输单词及其语义关联,帮助计算机像人类一样理解语言的复杂性。手动构建的著名印地语WordNet(HWN)包含各种经典的语义关系。为了处理不确定性并更语义化地表示HWN,类型1模糊图被应用于HWN中的关系。然而,类型1模糊集(T1FS)并未考虑经典成员关系的确定性。此外,从专家(人类)那里收集数十亿个(共5,55,69,51,753个)成员关系值也是不可行的。本文采用了区间值模糊图的概念,提出了区间值模糊印地语WordNet(IVFHWN)。IVFHWN利用词嵌入和词汇-句法模式自动识别单词之间的区间值模糊关系及其成员度。在词义消歧问题上的实验结果表明,使用IVFHWN代替类型1模糊印地语WordNet和经典印地语WordNet时,效果更佳。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号