跨语言句长分布规律研究:认知约束与体裁适应性驱动的普遍性模式

【字体: 时间:2025年09月24日 来源:Cognitive Science 2.4

编辑推荐:

  来自多国研究人员开展跨语言句长分布研究,发现句子与子句长度均符合扩展正负二项分布(EPNB),聚类分析结果与语言谱系相符,体裁与语言对不同层级语言单位的影响存在差异,揭示了 punctuation-based 句子切分的普遍概率模式及认知约束与体裁适应性的跨语言作用。

  

句子长度反映了认知约束以及为有效沟通而对言语和文本分割做出的风格决策,但句长分布是否在不同语言和体裁间遵循普遍模式仍不明确。本研究探讨句子长度和子句长度(定义为句子结束标点之间及相邻标点之间的词语数量)是否遵循跨语言的统一概率分布、是否反映语言谱系关系以及是否受体裁影响。基于句子长度与认知约束及风格决策的关联,研究人员预测句子和子句长度将遵循跨语言的统一概率分布,并受语言谱系和体裁调节。通过分析10种语言的新闻文本,发现句子和子句长度分布均符合扩展正负二项分布(Extended Positive Negative Binomial distribution, EPNB)——该模型先前已被证明可捕捉某些语言的句长分布。为评估分布差异是否与语言类型学一致,研究基于平均长度和分布参数进行聚类分析,结果映射出已知的语言谱系关系。为考察体裁效应,研究人员分析了英文和中文三种书面体裁中的句子和子句长度分布。广义线性模型(Generalized Linear Models)揭示了体裁和语言的系统性影响,但在不同语言层级上结果各异:体裁在句子层级指标上解释更多变异,而语言在子句层级影响更强。句子和子句长度分布反映了基于标点的句子分割的普遍概率模式,受到认知约束和体裁驱动的跨语言适应性的影响。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号