
-
生物通官微
陪你抓住生命科技
跳动的脉搏
PassionNet:基于多维度相似性评估与语言模型融合的软件需求重复与冲突检测创新框架
【字体: 大 中 小 】 时间:2025年06月23日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对软件需求工程中重复与冲突检测的多维度挑战,研究人员提出模块化框架PassionNet,集成10种相似性评估与8种语言模型,构建760条混合预测管道。实验表明其F1值较现有方法提升3%-5%,为需求分析提供语义-逻辑协同分析新范式。
在软件开发生命周期(SDLC)中,需求工程(RE)阶段长期面临重复和冲突需求的困扰。这些"需求债"不仅造成资源浪费——如开发团队可能重复实现相同功能,更会引发逻辑矛盾导致系统崩溃。现有32种AI检测方法虽采用CNN、LSTM等技术,但受限于单一维度分析,性能提升遭遇瓶颈。
德国研究人员Summra Saleem团队在《Expert Systems with Applications》发表研究,提出PassionNet框架突破这一困局。该研究创新性地融合8种语言模型(包括BERT、GPT等)与10维度相似性评估,构建三类预测管道:语言模型语义管道、多模型相似性管道及二者结合的混合管道。通过6个公共数据集验证,混合管道在WorldVista等数据集上F1值提升达5%,统计显著性p<0.1。
关键技术包括:1) 8种LLM上下文嵌入(ALBERT、DeBERTa等);2) 10种相似性计算(TFIDF、OkapiBM25等);3) 16种机器学习分类器;4) 3折交叉验证;5) 6项评估指标(Pr/R/F1等)。实验样本来自StackOverflow、Bugzilla等开源需求库。
【Architectural Design】框架采用模块化设计,三类管道协同工作:语言模型管道捕捉深层语义,相似性管道分析词法-句法特征,混合管道通过机器学习整合多维特征。
【Benchmark Datasets】在UAV等4个冲突数据集和2个重复数据集测试中,混合管道均表现最优,证明多维度联合分析的必要性。
【Experimental Results】640条混合管道显著优于单一方法,F1提升13%,其中DeBERTa+BM25组合效果突出。统计检验表明改进具有显著性(p值趋近0)。
【Limitations】存在计算资源消耗大、领域适应性待验证等局限,未来拟通过SHAP等可解释性工具优化。
该研究首次实证需求分析需同步考察语义、逻辑等多维度特征。部署的Web应用(https://sds_requirement_engineering.opendfki.de/)为工程师提供实用工具,其模块化架构也为NLP与软件工程交叉研究树立新范式。
生物通微信公众号
知名企业招聘