编辑推荐:
研究人员开展埃默里健康 AI 偏差数据马拉松研究,分析参与者情况及成果,为后续活动提供参考110。
在当今医疗领域,数字化进程不断推进,但临床医生和数据科学家之间却存在着明显的鸿沟,这一问题导致了诸多未解决的医疗质量问题。与此同时,医疗数据的价值日益凸显,如何利用这些数据来解决实际医疗问题、推动医疗创新成为了关键所在。在此背景下,数据马拉松(Datathon)这种汇聚各方人才、共同攻克难题的活动形式应运而生。它能将来自不同领域的专业人士聚集在一起,运用数据驱动的方法解决医疗保健相关挑战,在全球范围内已经有许多成功案例,对医疗研究和实践产生了积极影响。
为了进一步探索如何更好地利用数据解决医疗领域的问题,特别是针对人工智能(AI)在医疗应用中存在的偏差问题,埃默里大学(Emory University)等机构的研究人员开展了埃默里健康 AI 偏差数据马拉松研究。这项研究成果发表在《Journal of Imaging Informatics in Medicine》上,对该领域的发展具有重要意义。
在研究方法上,研究人员首先进行了精心的准备工作。在活动开始前近两个月,就组建了由不同背景专家组成的团队,为不同参与群体搭建服务器。活动过程中,共有 112 名参与者注册,他们被分成多个小组,每个小组都分配了特定的数据集、服务器和项目声明,研究主题涵盖验证骨关节炎评估的 ALP 评分、检测和减轻医学成像算法中的偏差、评估埃默里 ICU 数据集的偏差以及测试大型语言模型(如 ChatGPT)在健康领域的性能等。此外,研究人员还在活动结束后对参与者进行了问卷调查,收集反馈信息234。
下面来看看具体的研究结果。
- 参与者人口统计学特征:通过分析发现,参与者中亚洲人占比居多,男性比例略高于女性。从职业背景来看,计算机 / 数据科学家占比最大。
- 参与者的成就、失败、灵感等分享:在成就方面,参与者分享了各种各样的个人成就,包括在全国钢琴公会试镜中获得 “顶尖人才”、以单身母亲身份完成博士学业、在非洲中低收入国家开展创新健康项目获奖等。在失败经历中,参与者提到了如花费 9 年才获得跆拳道黑带、研究数据获取困难、学术求职失败、签证被拒等经历,但他们都从失败中汲取了坚持、适应等宝贵经验。谈及灵感来源,有人因一门课程爱上信息领域,有人受技术改善生活的潜力启发,还有人出于对家人健康的关心以及对社会公平的追求而投身相关领域。此外,参与者还分享了各自的幽默故事、兴趣爱好和宝贵建议567。
- 活动后的调查反馈:对 35 名参与者的调查显示,绝大多数参与者对活动给予了高度评价。77.14% 的参与者表示强烈希望参加更多类似的数据马拉松活动;54.29% 的人认为活动加速了医疗保健解决方案的开发;80.00% 的人认为团队间有效交流了专业知识;88.57% 的人认为与跨学科团队合作很有价值;65.71% 的人认为活动组织得很好;97.14% 的人表示很可能会向同事推荐该活动。这些反馈表明,此次数据马拉松在促进合作、知识获取和激发创新方面取得了显著成效8911。
研究结论与讨论部分强调,此次数据马拉松为参与者提供了一个进行有意义互动、知识交流和技能发展的平台。参与者在活动中表现出的韧性、奉献精神和创新贡献令人印象深刻。通过对参与者人口统计学特征、活动后调查反馈和背景的分析,研究人员全面了解了参与群体的多样性。同时,此次活动也暴露出一些问题,例如参与者背景差异较大,虽然期望他们具备一定健康、人工智能和编程知识,但仍有提升空间。因此,研究人员计划在未来的数据马拉松活动前举办暑期学校,帮助参与者提升相关技能。此外,亚马逊网络服务(AWS)为活动提供了良好的平台支持,未来组织者将继续使用该服务1210。
总的来说,埃默里健康 AI 偏差数据马拉松为未来类似活动树立了良好的榜样,突出了在健康数据科学领域促进多样性、合作和创新的重要性。它所积累的经验和教训将为该领域的持续发展和改进提供有力支持,推动健康数据科学不断向前发展。