编辑推荐:
在中药新药研发和临床双盲实验需求下,中药安慰剂的使用愈发重要。研究人员针对中药颗粒颜色多样难模拟的问题,开展基于机器学习构建颗粒颜色预测模型的研究。结果显示该模型预测效果良好,对研发临床适用的中药安慰剂意义重大。
在传统医学的广袤天地中,中药作为中华民族的瑰宝,历经数千年的传承与发展,在亚洲乃至全球的医疗保健领域都占据着重要地位。随着现代医学对中药独特药理作用和治疗潜力的深入挖掘,中药临床试验的需求与日俱增。而在这些临床试验里,安慰剂扮演着至关重要的角色。它虽然没有治疗成分,却要在外观和味道上与活性药物高度相似,以此确保试验的科学性和可靠性。
然而,中药颗粒的颜色丰富多样,从浅黄白色到棕黄色、红棕色,再到深黑棕色,跨度极大,细微的色调差异使得精确的颜色匹配困难重重。以往依靠人工比对和调色的方法,不仅效率低下、耗时费力,还带有很强的主观性,容易出现误差。不同人员调配出的安慰剂颜色差异较大,多次尝试调配又造成资源浪费,更严重的是,这种主观性可能影响参与者对治疗效果的预期和主观评价,干扰试验结果的准确性,进而破坏临床试验的有效性。
为了攻克这些难题,天津中医药大学现代中药创新与制造国家重点实验室、海河实验室等研究机构的科研人员开展了一项极具创新性的研究。他们旨在通过构建一个预测模型,精准模拟中药颗粒的颜色,为临床适用的中药安慰剂研发提供有力支持。该研究成果发表在《Chinese Medicine》杂志上。
研究人员在此次研究中运用了多种关键技术方法。他们收集了 52 种市售中药颗粒,用赋形剂和四种色素(柠檬黄、胭脂红、靛蓝和焦糖色)制备了 323 种模拟颗粒。利用可见光照相技术采集颗粒的 RGB 颜色数据,通过 Yolov5 目标检测算法识别目标区域,再借助 OpenCV 图像处理算法提取颜色数据。运用 KMeans 算法和主成分分析 (PCA) 等方法进行聚类分析,通过网格搜索和交叉验证评估多个回归模型 。
研究结果如下:
- 数据统计分析:中药颗粒的颜色范围为 R:87 - 253,G:70 - 247,B:43 - 234,模拟颗粒的颜色范围为 R:63 - 255,G:54 - 255,B:32 - 255。RGB 颜色散点图显示颜色数据分布分散无序,PCA 分析表明模拟颗粒颜色范围能涵盖中药颗粒,为后续预测模型提供基础。
- 聚类模型性能:KMeans 算法将中药颗粒颜色数据集聚成 2 - 11 组,肘形图和轮廓系数分析确定最佳聚类数为 2。这一结果反映出中药颗粒颜色存在明显的分类特征,为后续分簇建立回归模型提供了依据。
- 回归模型性能:多个回归模型对比显示,随机森林回归模型表现最佳,两个簇的相关系数分别为 0.9305 和 0.9193,平均 R2达到 0.9249 。SHAP 分析揭示了各特征对预测色素添加量的影响,不同颜色受不同 RGB 值影响程度不同。
- 颜色预测外部验证:对 10 种中药颗粒进行预测和制粒,预测颗粒与安慰剂之间的平均色差值 (ΔE) 为 2.7734,平均 RGB 相似度为 0.9999,人工感官评价的整体相似度得分为 0.9366,表明模型在颜色预测方面表现出色。
在研究结论与讨论部分,该模型有效满足了中药颗粒大规模颜色模拟的需求,能快速准确地进行颜色拟合,对研发临床可行的安慰剂具有重要价值。不过,研究人员也指出了未来的改进方向。一方面,可引入 HSV(色调、饱和度、值)和 CMYK(青色、品红色、黄色、黑色)等其他颜色空间,为模型提供更丰富的颜色信息,提升预测准确性。另一方面,要充分考虑设备差异、视角和光源等因素对颜色感知的影响,确保模型在不同环境下的稳定性和通用性。此外,持续扩充和更新预测模型的数据库,探索深度学习和神经网络技术,有望进一步优化颗粒颜色预测。同时,降低颜色差异阈值、引入色卡进行评分,能更精确地评估颗粒颜色相似性。
这项研究为中药安慰剂的研发开辟了新路径,极大地推动了中药临床试验的规范化发展,让中药在现代医学的舞台上绽放更耀眼的光芒,为人类健康事业做出更大贡献。