
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Hadamard编码的数字滤波基因组蛋白编码区识别方法及其生物医学应用
【字体: 大 中 小 】 时间:2025年06月20日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
本研究针对基因组序列中蛋白编码区(exonic regions)识别精度不足的问题,提出了一种整合Hadamard编码(HBNE)与椭圆滤波器(Elliptic filter)的高效检测方法。通过将DNA序列转换为数值信号并利用三碱基周期性(TBP)特征,团队在秀丽隐杆线虫(Caenorhabditis elegans)基因组测试中实现95%的准确率,曲线下面积(AUC)达92%,为基因注释和疾病相关研究提供了新工具。
研究背景与意义
基因组中仅约2%的序列参与蛋白质编码,如何精准定位这些区域是生物医学领域的核心挑战。传统方法依赖耗时费力的实验技术,而数字信号处理(DSP)通过分析DNA序列的数值特征提供了高效替代方案。其中,三碱基周期性(TBP)——源于密码子三联体结构的频谱特征(频率1/3峰值)——成为区分编码区与非编码区的关键指标。然而,现有数值映射方法如Voss、Walsh编码(WCBNE)等存在维度爆炸或生物特性缺失等缺陷,制约了检测效率。
研究方法与技术
来自VIT的研究团队开发了基于四阶Hadamard矩阵的数值编码方法(HBNE),结合椭圆滤波器与高斯窗技术,通过以下步骤实现优化:
研究结果
结论与展望
该研究首次将Hadamard矩阵引入基因组信号处理,其正交特性有效降低了计算复杂度并提升特异性。相较于整数编码(IBNE)或三角函数编码(TCNE),HBNE在保持生物信息完整性的同时,为大规模基因组注释提供了自动化解决方案。未来可扩展至人类疾病基因筛查或农业基因组优化领域。论文发表于《Computers in Biology and Medicine》,为交叉学科研究提供了范式。
生物通微信公众号
知名企业招聘