德国版“癌症风险评估多维影响(Multidimensional Impact of Cancer Risk Assessment, MICRA)”问卷的开发与语言验证

《Journal of Genetic Counseling》:Development and linguistic validation of the German “Multidimensional Impact of Cancer Risk Assessment” (MICRA) questionnaire

【字体: 时间:2026年06月12日 来源:Journal of Genetic Counseling 1.9

编辑推荐:

  识别遗传性癌症综合征可实现个体化治疗、预防措施及识别其他高危家族成员。然而遗传检测常伴随心理社会应激,因而亟需可靠的患者报告结局测量工具(patient-reported outcome measures, PROMs)。25条目癌症风险评估多维影响(Mult

  
识别遗传性癌症综合征可实现个体化治疗、预防措施及识别其他高危家族成员。然而遗传检测常伴随心理社会应激,因而亟需可靠的患者报告结局测量工具(patient-reported outcome measures, PROMs)。25条目癌症风险评估多维影响(Multidimensional Impact of Cancer Risk Assessment, MICRA)问卷用于捕捉遗传检测结果告知后的心理社会影响,包括痛苦与不确定性。鉴于尚无德语版本,研究人员旨在开发经语言验证的德语译版,并探讨基于人工智能(artificial intelligence, AI)的翻译工具在翻译过程中的辅助潜力。语言验证遵循慢性病治疗功能评估(Functional Assessment of Chronic Illness Therapy, FACIT)翻译方法学,包括两名独立正向翻译、调和、回译、专家评审及最终校对,形成用于试点测试的预备德语版。于2024年11月在汉诺威医学院对10名正在接受遗传性乳腺与卵巢癌遗传咨询与检测的咨询者进行认知访谈(cognitive debriefing),试点测试于2023年6月至2024年7月间招募。翻译过程产生被试点组良好理解的德语MICRA版本,无参与者填写时需要协助。两名及以上参与者提出的问题(如某些应答选项相似)经评估但未导致修改。将译版与ChatGPT-4o及DeepL Translator输出比较,聚焦于人类译者亦需讨论的条目,两模型均遗漏语境或情感细微差别,凸显AI在复杂翻译任务中的当前局限;但结合专家评审,AI仍具辅助工具前景。综上,本研究提供了首个经语言验证的德语MICRA问卷,为遗传咨询与研究评估心理社会结局提供有价值资源。
该研究发表在《Journal of Genetic Counseling》。目前,遗传性癌症综合征的识别虽可实现个体化治疗、预防及家族高危成员筛查,但遗传检测及结果告知常引发显著心理社会应激(如痛苦、不确定性、适应困难)。为捕捉这些影响,患者报告结局测量工具(patient-reported outcome measures, PROMs)尤为关键,其中癌症风险评估多维影响(Multidimensional Impact of Cancer Risk Assessment, MICRA)问卷是针对高风险癌症临床场景设计的25条目4点Likert量表,含痛苦(distress)、不确定性(uncertainty)、积极体验(positive experiences)三个子领域,已被多国使用,但此前无经过语言验证(linguistic validation)的德语版本。若直接在德语区使用英语原版或未经严谨跨文化调适的译本,会因概念不等价、文化不适配而影响数据完整性与跨文化可比性。因此研究人员开展本研究,依据慢性病治疗功能评估(Functional Assessment of Chronic Illness Therapy, FACIT)方法学开发首个德语MICRA版本并进行语言验证,同时探索AI翻译工具(ChatGPT-4o、DeepL Translator)在此类敏感心理测评问卷翻译中的适用性与局限。研究得出结论:经多步骤人工翻译与10例目标人群认知访谈(cognitive debriefing)验证的德语MICRA具备概念等效性、清晰度与文化适切性,可直接用于德语区临床科研与实践;AI模型虽在常规条目上输出可接受,但在时态适配、情感细微差别、句式结构转换、避免外行误解(如positive/negative译作auff?llig/unauff?llig而非positiv/negativ)、应答量表匹配等需语境判断处存在缺陷,须以专家评审为必要保障。该德语版本的发布填补了资源空白,为德语区遗传咨询中心理社会影响评估提供标准化工具,也对PROMs跨文化翻译中如何合理整合AI效率与人类专业判断具有方法学启示。
为开展研究,研究人员主要采用以下关键技术方法:遵循FACIT翻译方法学框架,首先由两名独立译者进行英语至德语正向翻译(forward translation),侧重意义等效而非字面译,并参考既有问卷翻译记忆库以保证术语一致性;其次由第三名独立译者调和(reconciliation)两份正向译本差异并形成调和版;再由一名以英语为母语、流利德语的双语译者进行盲态回译(back-translation)至英语,由FACIT翻译经理比对源文核查等效性,问题反馈至语言协调员(项目团队第四方)修订,经FACIT翻译经理与语言协调员排版校对后形成预备德语版;随后进行定性验证:获得伦理批准(编号11606_BO_K_2024)后,样本队列来源于汉诺威医学院人类遗传学系2023年6月至2024年7月间接受遗传性乳腺与卵巢癌遗传咨询与检测的10名≥18岁德语母语女性咨询者,通过认知访谈(cognitive debriefing)流程(使用FACIT标准访谈脚本,受试者先独立填答问卷,再由访谈者询问理解难度、自然度、相关性缺失等,并要求逐条用自己的话释义、举例,记录是否需协助),音频转录后由语言协调员与FACIT翻译经理提炼≥2名参与者反馈的主题以评估调优;作为探索性分析,研究人员于2025年2月用DeepL翻译专业版与ChatGPT-4o(初始提示仅为“请译为德语”)翻译同一源问卷,重点对比人类译者曾争议或困难的条目,与最终FACIT版逐项分析差异。
研究结果如下:
3.1 语言验证(Linguistic validation):多步骤FACIT流程(独立正向翻译、调和、回译、专家评审)顺利完成,形成预备德语MICRA。认知访谈参与者年龄40–59岁,均为女性,8名生于德国、各1名生于荷兰与俄罗斯。整体理解度高,无人需填答协助。3.1.1 问卷结构评价:多名参与者认为部分条目应答选项“从不(Nie)—0;少见(Selten)—1;有时(Manchmal)—3;经常(Oft)—5”不合适、建议是/否格式(如第3条“我在意……”或“我难过频率”),但改动会过度偏离原版,且部分参与者忽略“过去7天”时限(原文有下划线强调与提醒),故保留原结构、顺序与数值;3名参与者觉得“selten(少见)”与“manchmal(有时)”过相似,但替代词无更优区分、频率归属主观差异大,故保留原选项。3项指令中9人认为无混淆,1人需多读几次首条指令但无改进建议,确认指令清晰。3.1.2 参与者理解评价:逐条释义显示情绪词(愤怒、宽慰、担忧、喜悦、挫败、关切,对应条目1、5、8、9、14、16)总体易懂;条目4“I felt guilty about my test result”有4人理解为将遗传易感性传给子女的罪责感(后续条目专述),但因原版刻意宽泛,故不修改;条目6“I was concerned about how my test results would affect my insurance status”参与者主要联想健康保险(德语区因病多不改变医保地位,其他保险若检测前购置亦不受影响),考虑过改为“是否引致保险公司困难”,但无参与者明确提此,且歧义源于源条目而非翻译,为保概念等效保留“Versicherung”原译;条目24(“遗传结果使应对癌症更难”)与25(“使应对更易”)有个别参与者难区分(反向计分题常见设计旨在减少应答偏差),故保留。综合≥2人反馈后决定不做更改,译版概念准确、语言适切。
3.2 AI比较:聚焦人类译者也曾困难的条目做AI与原版比对。整体AI输出大体可接受但未达敏感语境要求:时态方面,英语源用现在分词式标题(如“Feeling sad about my test result”)省略主语时态,指令要求答过去7天,AI均直译为现在时(DeepL:“Ich bin traurig…”;ChatGPT:“Ich fühle mich traurig…”),需人工提示才改过去时(“Ich war…traurig”),研究人员最终选用过去时匹配时限;情感细微差别如“upset”DeepL译“ver?rgert(恼怒)”偏窄,ChatGPT译“aufgewühlt(情绪波动)”偏泛,研究人员选“aufgebracht”以涵盖内乱、愤怒、失望交织义;句式结构:英语省略主+助动词用动名词名词化(如“Feeling guilty…”),德语无法无动词残缺,DeepL转名词“Schuldgefühle…”,ChatGPT补全“Ich fühle mich…”,人类译者同样倾向完整句子保易懂;避免误解:源“positive/negative test result”AI直译“positiv/negativ”,对非专业者易按日常义误解(阳性=好),研究人员改“auff?llig(异常检出致病变异)/unauff?llig(无异常检出)”以中性明确;应答量表匹配:条目“Understanding clearly my choices for cancer prevention or early detection”AI译“Ich verstehe klar…/Ich wei? genau…”未匹配“nie/selten/manchmal/oft”频度量表,人类译者调整为“Meine M?glichkeiten…waren für mich klar verst?ndlich”以契合频率应答。综上AI可作支持但关键处需专家裁决。
讨论部分总结:遗传研究中心理社会数据对理解基因—环境—行为交互至关重要,PROMs如MICRA已被多国用于测评遗传检测心理影响(如多癌早检、多基因面板检测、等待结果焦虑等),但此前无验证德语版。本研究按FACIT框架(国际公认稳健方法,符合FDA、EMA关于跨国试验翻译需语言与文化有效性证据的要求)在FACIT翻译经理督导下完成首版德语MICRA语言验证。FACIT强调概念而非字面等效,含双正向、调和、回译、专家评审、患者预试,与本领域最佳实践(ISPOR等)一致,该法已支撑FACT-G等工具在75种语言验证。本研究每步有遗传、医疗、患者研究专家参与保术语准与受众适切,但初始翻译无可避免受译者语言习惯微影响。认知访谈靶点是遗传性乳腺与卵巢癌咨询女性(高相关但样本小、同质:10名40–59岁女性),限制推广至男性、其他综合征人群,未来需在更广队列量化验证(如测量属性检验)。但定性验证显示靶群体理解良好,少量反馈未动摇概念等效与文化适切,版本可用。探索性AI比较表明:ChatGPT-4o、DeepL于常规条目尚可,但在语境依赖(时态、情感微差、英语省略句式转德语完整句、医学术语日常义歧义如positive/negative、应答量表匹配)处失利,需迭代专家共识保临床与文化合宜,佐证传统语言验证不可缺;AI宜为辅助非替代,未来可系统评估“AI处理简单重复条目+专家处理概念难点”分工。本研究局限:AI评仅项目组内行、无外部验证与认知访谈;ChatGPT用无提示工程(未加语境、受众、语气、翻译记忆等),若优化提示或用新版(如GPT-5、DeepL“Clarify”)可能提升表现;部分挑战(如频率选项适配、positive/negative外行歧义)源出原问卷而非翻译或AI,为保等效未改但解释数据时应注意。结论:第一,研究提供首个经语言验证德语MICRA,填补德语区遗传咨询心理社会测评空白,按FACIT确保概念等效、清晰、文化适切,可供临床科研使用,为后续德语人群测量等值(如信效度)定量验证奠基,可助遗传咨询师识别高痛苦、不确定性、适应不良者并定向支持。第二,AI翻译工具在需情感色调、复杂心理建构处不足,但具优化潜力,未来应系统整合进既定验证流程。德语版发布于https://www.facit.org/measures/micra
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号