
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于进化算法的概率逻辑程序结构学习方法研究及其在不确定性推理中的优化应用
【字体: 大 中 小 】 时间:2025年06月17日 来源:Knowledge-Based Systems 7.2
编辑推荐:
本研究针对概率逻辑编程(PLP)结构学习这一长期挑战,创新性地提出基于进化算法(EA)的ellepi方法。研究团队在EMBLEM和LIFTCOVER参数学习框架基础上,通过种群进化机制探索规则空间,在12个基准数据集上验证显示:相比传统beam search方法,新方法在log-likelihood、AUCROC和AUCPR指标上表现更优,且能生成更精简、可解释性更强的理论。该成果为处理不确定知识的自动推理提供了新思路,发表于《Knowledge-Based Systems》。
在人工智能领域,如何让机器从不确定数据中自动学习可解释的规则一直是个核心难题。概率逻辑编程(Probabilistic Logic Programming, PLP)将逻辑编程的表示能力与概率推理相结合,为这个问题提供了优雅的解决方案。然而,当面对结构学习任务——即从数据中同时学习规则结构及其概率参数时,传统方法如SLIPCOVER和LIFTCOVER采用的beam search策略往往陷入局部最优,且生成的理论复杂度较高。这正是本研究要突破的关键瓶颈。
针对这一挑战,研究人员创新性地将生物启发的进化算法引入PLP结构学习领域。研究团队开发了名为ellepi的进化学习框架,其核心思想是将每个候选程序视为种群中的个体,通过选择、交叉和变异等进化操作探索规则空间。该方法巧妙结合了两种成熟的参数学习技术:基于BDD知识编译的EMBLEM和基于提升推理的LIFTCOVER,在保持概率推理严谨性的同时大幅提升了搜索效率。
技术方法上,研究主要采用:1)基于模式声明的语言偏置定义搜索空间;2)基于加权采样的种群初始化策略;3)包含规则添加/删除和原子替换的多层次变异操作;4)年龄正则化的种群更新机制;5)五折交叉验证评估框架。实验覆盖12个典型数据集,包括医疗(bupa)、生物(yeast)和金融(fin)等领域。
研究结果方面:
算法设计:ellepi的创新性体现在三方面:首先,个体表示为规则集合而非单一规则,支持更全局的优化;其次,变异操作可同时修改规则结构和变量实例化;最后,年龄正则化平衡了探索与开发。
性能比较:在多数数据集上,ellepi的log-likelihood显著优于对比方法。例如在carc数据集,仅用5条规则就达到0.704的AUCPR,而LIFTCOVER需要500+规则。统计检验显示p<0.05的显著差异。
理论质量:进化算法产生的程序平均规则数比SLIPCOVER少47%,比LIFTCOVER少89%,同时保持更高准确性,证实了"小而精"的优势。
计算效率:虽然进化过程增加了时间成本(比LIFTCOVER慢3-10倍),但通过种群并行化可缓解该问题。值得注意的是,参数学习耗时占总运行时间的95%以上。
鲁棒性测试:增大传统方法的beam size反而导致性能下降,验证了进化策略在全局搜索上的优势。
结论与讨论部分指出,这是首次将进化算法系统应用于PLP结构学习任务,突破了传统局部搜索的限制。方法学贡献主要体现在:1)建立了进化操作与逻辑规则空间的映射机制;2)验证了遗传算法在保持理论简洁性方面的优势;3)为概率逻辑与进化计算的交叉研究开辟了新方向。
该研究的实际意义在于:医疗领域可帮助从嘈杂的临床数据中发现可靠诊断规则;金融领域有助于构建可审计的风险评估模型。未来工作将聚焦于并行加速和连续变量处理,进一步推动概率逻辑学习在复杂系统建模中的应用。这项工作发表于《Knowledge-Based Systems》,为知识表示与推理领域提供了重要的方法论创新。
生物通微信公众号
知名企业招聘