
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通过调整类别权重和优化特征,在泰米尔语混合编码数据中检测滥用评论
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Abusive Comment Detection in Tamil Code-Mixed Data by Adjusting Class Weights and Refining Features
【字体: 大 中 小 】 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
针对低资源语言泰米尔-英语混合文本的滥用评论检测问题,本研究提出融合定制训练词汇、统计与语言无关特征选择及解释性AI优化的新方法。实验在失衡数据集上取得74%准确率和0.46宏F1值。
生物通微信公众号
知名企业招聘