编辑推荐:
为评估多模态大语言模型(LLM)Claude 3.5 Sonnet 解读睑板腺照相(meibography)图像用于睑板腺缺失分级和形态异常检测的性能,研究人员开展相关研究。结果显示其分级准确率高,还能精准检测异常,为眼科临床提供新工具。
目的:评估多模态大语言模型(LLM)Claude 3.5 Sonnet 解读睑板腺照相(meibography)图像以进行睑板腺缺失分级和形态异常检测的性能。
方法:同一位研究人员分析 228 张睑板腺照相图像,从腺体缺失率和形态异常两方面进行评估。睑板腺缺失分为 0 级(无缺失)至 3 级(腺体总面积缺失 > 2/3),纳入 160 张图像(每级 40 张)。使用美国加州 Anthropic 公司开发的多模态 LLM——Claude 3.5 Sonnet,探究其评估睑板腺照相图像的性能。
结果:Claude 3.5 Sonnet 在睑板腺缺失分级中表现优异,0 级、1 级、2 级和 3 级图像的正确评分率分别为 97.5%、92.5%、95% 和 85%。此外,该模型在检测形态异常(包括管腔直径不均、管腔迂曲、管腔长度缩短和腺体高反射残留)方面表现出色,准确检测出全部 48 处人工识别的形态异常。在 12 张人工评估初始判定为形态正常的图像中,模型还报告了额外的细微异常。
结论:Claude 3.5 Sonnet 在解读睑板腺照相图像、检测形态异常以及区分正常与异常睑板腺方面显示出良好效果,有望作为眼科诊所的辅助教育工具。该模型进行详细形态评估并回答进一步问题的能力,为年轻眼科临床医生提供了定制化的学习体验。