生成式人工智能(GenAI)和社交媒体如何为癌症幸存者及专业人士提供心理社会信息支持?通过结构化主题建模进行探索与比较
《European Journal of Oncology Nursing》:How do GenAI and social media provide psychosocial information support for cancer survivors and professionals? Using structural topic modeling for exploration and comparison
【字体:
大
中
小
】
时间:2025年10月22日
来源:European Journal of Oncology Nursing 2.7
编辑推荐:
本研究通过结构主题模型(STM)对比分析社交平台(微信、小红书)和生成式AI(DeepSeek、ChatGPT)中的癌症心理社会护理信息。发现社交平台侧重儿童心理护理、家庭动态等具体场景,呈现碎片化特征;而AI生成内容涵盖更广泛的主题,但存在信息过载和结构局限。结论强调需整合专业监督、AI工具和云平台,构建伦理合规的混合护理模式。
癌症不仅是一种全球范围内的主要致死原因,还对癌症患者、接受治疗的个体以及长期与癌症共存的幸存者造成深远的心理社会影响。这些心理社会结果包括社交关系的疏离、情绪困扰、生活质量下降以及其他与治疗相关的复杂问题。这些心理社会问题凸显了癌症幸存者在情感支持、身体功能管理、信息获取和社交支持网络方面的重大需求。尽管心理社会肿瘤学护理在过去几十年中取得了显著进展,但服务可及性和专业人员数量的不足仍然限制了该领域的实践推广。未满足的心理社会需求已成为全球关注的焦点,无论癌症类型或年龄群体如何,都会影响幸存者的福祉和健康结果。特别是在疫情后,这些需求变得更加迫切,尤其是在发展中国家,心理社会护理的可及性依然有限。
心理社会肿瘤学信息是指帮助癌症幸存者和专业人员理解、预期和选择应对心理社会问题的健康信息。这类信息不仅对幸存者具有教育意义,还对他们的护理者起到重要作用,有助于提升公众对心理社会肿瘤学的认知和健康促进。实证研究表明,获取信息资源是决定癌症幸存者心理社会福祉的关键因素。更易获得心理社会肿瘤学信息与生活质量、情绪困扰和求助行为的改善密切相关。因此,理解和分析这些信息对于制定有效的心理社会护理策略至关重要。
在中国,作为发展中国家的代表,人口超过十亿,每年报告数百万例新的癌症诊断。中国癌症幸存者主要报告在长期幸存、寻求心理支持以应对情绪困扰、帮助解决经济和社会困难以及身体功能的随访护理方面存在未满足的需求。这些未满足的信息需求导致的心理社会问题尤为普遍,并与幸存者的健康素养和参与心理社会护理的程度密切相关。此外,中国临床环境中,医疗专业人员,包括医生、肿瘤科护士和社会工作者,由于信息获取受限、培训不足、干预指导不明确和意识较低,持续面临提供心理社会肿瘤学护理的挑战。大多数专业人员依赖个人经验提供非结构化的心理社会护理,缺乏与正式心理社会框架的整合。在这些专业人员中,肿瘤科护士在提供心理社会和临终关怀方面发挥着主导作用。然而,他们仍然报告在临床环境中信息获取不足、知识有限和培训不够。
因此,缺乏系统性的知识和监督导致在为幸存者及其家庭提供心理社会护理时产生犹豫甚至回避。一个显著的趋势是许多专业人员越来越依赖在线信息来获取心理社会肿瘤学信息,以提升他们的实践水平。然而,心理社会肿瘤学护理仍是一个复杂的领域,需要专业知识、治疗技能和特定情境下的信息。虽然社交媒体和GenAI提供了可访问且定制的信息,但它们可能无法完全复制人类在护理决策、判断、同理心和情境敏感性方面的独特能力。特别是,网络内容往往忽视了癌症讨论中的社会文化细微差别,例如中西方对癌症宿命论的不同信念。此外,数字信息可能会使那些在探索心理社会困扰时仍感到困扰或羞耻的癌症幸存者边缘化。鉴于心理社会肿瘤学信息塑造了公众在处理癌症相关困扰时的看法和行为,这些障碍可能导致对心理社会肿瘤学护理的误解,从而影响癌症幸存者和医疗专业人员的服务提供和接受度。
GenAI和社交媒体的新兴信息补充了心理社会肿瘤学护理,但需谨慎对待。虽然这些内容具有益处,但也可能通过不完整的信息强化误解或限制公众对心理社会肿瘤学的认知。目前,很少有研究专门探讨心理社会肿瘤学如何在社交媒体和GenAI上构建。此外,文本挖掘方法,如主题建模,仅限于探索大规模数字内容中的心理社会肿瘤学相关主题。虽然近期研究已将主题建模应用于分析癌症相关认知问题、心理社会需求、幸存者的生活质量和相关研究文章,但这些研究并未特别关注心理社会肿瘤学信息。这些研究展示了主题建模在分析大规模非结构化数据以揭示幸存者经验、趋势和知识结构方面的潜力。然而,主题的特定性有限,这凸显了进一步整合高级主题建模方法以获得更具体结果的必要性。这些差距表明,应用高级主题建模方法可以揭示特定的心理社会肿瘤学信息。本研究通过主题建模方法探索了社交媒体和GenAI上的心理社会肿瘤学相关信息。理解这些信息的性质是丰富基于证据的干预策略以深入了解癌症幸存者和医疗专业人员的担忧和信息需求的重要一步。最终,本研究可能促进反思,并激发跨学科合作,以改善心理社会肿瘤学护理的信息管理,从而增强护理实践和幸存者的福祉。
本研究采用了定性设计,结合结构主题建模(STM)方法,以分析社交媒体(微信和红笔记)和GenAI(DeepSeek和ChatGPT)上的心理社会肿瘤学信息。具体而言,使用基于R和GenAI的软件进行STM分析。图1展示了所提出方法的框架,包括数据收集和数据分析。所有作者均拥有博士学位水平的定性研究培训和相关领域的专业知识。第一作者性别为男性,第二和第三作者为女性。本研究中的数据引用由第一和第二作者从中文翻译成英文。为确保准确性和文化有效性,所有翻译均通过回译验证,并由具有中文背景的第三作者进行审查。本研究的报告遵循了定性研究报告标准(SRQR),以确保透明度和方法学严谨性。
STM是一种文本挖掘分析方法,用于揭示社交媒体平台或其他语料库(如微信、WhatsApp和X)中的大规模文本数据,从而探索非结构化文本数据。作为主题建模的一种形式,STM已成为文本解释的强大工具,通过统计和机器学习辅助的无监督分析减少定性编码中的主观性。技术上,STM基于自然语言处理(NLP)和机器学习技术,并通过“stm” R包实现。具体而言,该方法在结合元数据时识别潜在主题,从而分析主题的普遍性、主题关系和话语模式,使主题能够独立探索。此外,新兴研究已证明GenAI驱动的主题建模在大规模语料库文本挖掘和文本数据分析中的可行性和潜力。
在社交媒体上收集心理社会肿瘤学信息时,采用目的性抽样策略,并结合Python程序获取符合以下纳入标准的相关帖子。首先,帖子需包含关键词“癌症”和“心理社会”,以及子关键词“情绪”、“财务”、“关系”或“家庭”。这些子关键词在初始搜索结果中较为常见,并包含在国家综合癌症网络(NCCN)指南(版本1.2025)的常见心理社会问题列表中。纳入标准旨在聚焦相关帖子,同时减少样本中的噪声,例如仅提及“心理社会”一词但无实质内容的帖子。其次,内容需涉及与心理社会肿瘤学相关的经验、信息、知识或技能。第三,帖子的发布日期需在2016年至2025年5月之间。
排除标准包括:(1)仅讨论生物医学方面的帖子,如化疗决策或治疗计划;(2)与主题无关的帖子,包括健康产品广告、电影角色讨论、转载的学术文章以及仅提及关键词但无实质性内容的帖子;(3)重复和异常高频发布的帖子。为确保数据的可信度,采用了手动审查所纳入帖子的验证策略。第一和第二作者独立审查数据,并就最终样本达成共识,Cohen's Kappa值为0.86。这些社交媒体平台的编辑审查被视为数据可信度的补充。
所有收集的数据均为中文,并存储在CSV文件中以供进一步分析。内容包括标题、正文、发布日期和媒体平台。初始样本包含1572条帖子(红笔记968条,微信604条)。在数据清洗后,最终样本包括1177条帖子。
在GenAI上收集的信息来自ChatGPT-4o和DeepSeek-R1。这两款GenAI已被用于解决癌症相关心理社会困扰和问题的先前研究中。此外,先前研究已验证ChatGPT-4o和DeepSeek-R1能够提供健康信息支持,易于使用且值得信赖。数据收集通过各自的ChatGPT-4o和DeepSeek-R1版本进行,这些版本于2025年6月发布,所有响应均以中文生成。设计的提示基于适当性、唤起性和整合性(Rospigliosi, 2023)的互动原则,并参考了先前研究中用于考察GenAI在心理肿瘤学支持中的提示(Chow et al., 2025),以确保聊天机器人的响应质量。总共使用了九个提示,每个类别三个,以获取GenAI在“新聊天”功能中的响应。表1展示了所用提示的示例。
通过这种标准化方法收集的数据旨在评估GenAI生成响应在心理社会肿瘤学背景下的准确性和全面性。这些结果将在同一聊天中进一步分析。
在社交媒体上进行的数据分析采用了STM方法,包含四个步骤,利用R v4.4.1进行。首先,收集的数据经过预处理,包括词分割、使用识别字典、去除停用词、数字和标点符号,通过“stm”和“Jieba”包实现(Roberts et al., 2019;Peng et al., 2025a)。基于Trie树结构算法的词分割实现了对中文字符在句子中的词图扫描,以识别所有可能的词形组合。其次,预处理后的数据通过STM模型进行分析,以估计语料库结合的文本和元数据。这一过程估计了每个主题对心理社会肿瘤学信息的贡献程度(Roberts et al., 2019)。第三,为了确定主题数量(K,STM的重要参数),使用“stm”包中的“搜索K”功能进行迭代评估。最终确定K值基于交叉验证的似然(每个解决方案的模型拟合)和语义一致性,表明这些模型的交叉验证似然和语义一致性。主题解决方案从3到10个(基于初始估计和样本数量),每次增加1个。图2展示了每个模型解决方案的指标性能。通过考虑这些模型指标,5个主题的解决方案在各项指标之间取得平衡,并表现出良好的内部一致性和交叉验证似然。具体而言,5个主题的解决方案在K=3-5范围内具有相对较高的交叉验证似然,并且在K=5-10范围内具有良好的模型拟合和较低的残差。可接受的语义一致性(在K=7-10范围内下降和扁平化之前)对应于下限的改善趋势,表明K=5是一个强解决方案,可能在过度拟合之前。总体而言,K=5比K=3和K=6更易于解释和语义清晰。该模型的交叉验证似然为-8.13,语义一致性得分为-36.44。
在GenAI生成内容上进行的STM分析显示,GenAI驱动的STM能够识别出与心理社会肿瘤学相关的主题。GenAI驱动的STM基于自然语言处理(NLP)和机器学习,能够从文本语料库中提取主题(Ma et al., 2025)。结合生成预训练转换器(GPT)模型,GenAI能够利用上下文信息(即生成结果)进行主题模型分析(Ma et al., 2025)。GenAI驱动的主题建模整合了AI算法和主题建模程序,能够进行全面的主题分析,并通过可靠的主题总结和主题指标澄清来提升主题解释的可靠性(Alharbi et al., 2024;Ma et al., 2025;Prakash et al., 2025)。GenAI驱动的主题建模在准确性上与专家手动评审程序类似或更优(Ma et al., 2025;Prakash et al., 2025)。
分析过程包括以下步骤。首先,GenAI对九个标准化提示生成响应,这些响应被综合为一个用于GenAI驱动STM分析的数据集。此外,GenAI通过错误检测、数据填补和匹配自动处理数据集的清洗和预处理,确保该数据集用于GenAI驱动STM的有效性(Zhang et al., 2023)。分析应用了多种提示工程技术(Alharbi et al., 2024),包括:“请执行结构主题模型,总结和可视化你对上述九个提示的回答,提供关键主题、关键词、主题普遍性和主题相关性,基于生成的内容”。这些提示使GenAI能够通过生成数据(包括九个回答)的语义聚类计算主题普遍性和主题相关性,并进一步揭示重复率的聚类相关性,这与原始STM模拟。例如,一个主题的普遍性为10%表示该数据集中有10%的内容由该主题的词汇主导。由于GenAI生成的数据不包含元数据,分析提示未能捕捉这些文档的纵向趋势。此外,使用了额外的提示,如“请提供模型评估参数”和“请基于主题关键词和场景生成主题标签”,以进行二次分析结果并确保模型的验证。最终结果呈现了所识别主题的普遍性和主题关系,这与社交媒体内容的数据分析策略一致,以确保数据可信度。
本研究的讨论部分强调了社交媒体和GenAI在心理社会肿瘤学信息上的不同表现。社交媒体上的信息构建为深入和主题聚焦,针对特定人群的需求,如儿科癌症患者的心理社会困扰(主题1)。具体而言,社交媒体帖子指出“身体形象的改变对自尊产生深远影响……长期住院和治疗干扰了儿童的发展”(微信,文档122),扩展了用户对影响儿科癌症患者因素的理解。事实上,儿童癌症幸存者面临由癌症治疗带来的不利的身体、心理和社会影响。他们通常报告的抑郁症状显著高于无癌症的同龄人(Li et al., 2013)。癌症干扰了他们与父母和朋友相处的时间,并留下可见的提醒,如化疗后的疤痕或头发生长不良(Brown et al., 2016;Peng et al., 2025b)。这些经历导致生活观点的改变、自我认知的转变以及长期对人际关系和社会参与的影响,造成对癌症复发的担忧、信心的丧失和人际关系的减少(Brown et al., 2016)。护理者的反思(主题5)展示了个人价值观和身份的面对面反思,如“我之前给父亲展示的‘善意’可能并非真正对他有益……我还没有完全接受父亲被诊断出癌症的事实。但内心深处,我拒绝失去他的事实。因此,我所做的每一件事都是出于强烈的依恋感——一种想要改变现状或让他的命运符合我自己的愿望:他能活得更久并陪伴我和我们的家庭”(红笔记,文档690)。这些话语传达了护理癌症幸存者的人类经验,这目前尚无法被GenAI的文本所取代。嵌入在社交媒体上的信息展示了用户需要自己去获取或由平台算法传递的特定心理社会主题的聚焦图像。相比之下,GenAI的信息呈现出不同的模式,即提供简明、结构化和全面的信息(即更多相关主题),引导用户快速获取心理社会肿瘤学护理和困扰的图像。例如,GenAI的响应倾向于介绍心理社会肿瘤学护理,包括“心理社会肿瘤学护理的关键组成部分……为什么重要?”(ChatGPT)。这些响应模式为用户提供了丰富的知识,这与Chou等人(2025)的观点一致,他们强调GenAI在为幸存者和专业人员提供临床信息方面的潜力。然而,GenAI响应的过度概括可能会使用户在寻求特定信息或在临床情境中进行实际应用时感到困惑和负担。
值得注意的是,社交媒体和GenAI的发现都指出了癌症相关心理社会困扰求助或转介资源的不足。在微信和DeepSeek上,只有少数本地咨询热线或互助应用正在出现,这显示了在线平台在伦理或临床情境中的严重局限性,这与Chow等人(2025)的观点一致。资源包括“资源导航:中国抗癌协会心理热线400-660-9190;线下求助,任何医院的心理社会肿瘤学部门;寻求同伴支持”(DeepSeek)。事实核查表明,DeepSeek列出的热线并不存在,这代表了严重的失败,阻碍了幸存者和专业人员获取所需支持,并可能导致他们被误导到虚假信息上。尽管DeepSeek在生成心理社会肿瘤学信息时具有文化敏感性(即特定情境下的响应),与ChatGPT相比,其内容的可靠性仍有待提高。
本研究从话语视角出发,探讨了心理社会肿瘤学信息在公众意识中的主导地位。这些信息构建了在癌症诊断、护理和康复过程中形成的主导话语,影响了癌症幸存者和专业人员在应对困扰时的社会和心理行为调节(Foucault, 1982;Willig, 2011)。从这一视角来看,本研究强调,尽管心理社会癌症信息在这些工具中逐渐出现并广泛传播,但这种信息时代是否真的为需要心理社会信息的人提供了所谓的“真相”值得反思。例如,研究发现,一些社交媒体帖子使用“哀伤阶段”来概念化癌症幸存者的心理状态,而GenAI则为专业人员提供了大规模的心理治疗方法指导,但未考虑这些生物医学培训的临床工作者如何操作这些方法(Peng et al., 2025c;Zheng et al., 2021)。这一反思突出了心理社会肿瘤学信息话语构建的潜在问题。尽管这些构建提供了初步评估和管理心理社会困扰的机会,但可能伴随限制和约束,导致在应对癌症或护理癌症幸存者时产生恐惧、信息过载和自我效能感的负面影响(Willig, 2011)。因此,对特定构建(即其主观性、目的和效果)如何调节幸存者和专业人员实践的批判性思考,将扩展这些心理社会肿瘤学信息和心理社会影响的社会实践意义。
本研究强调了心理社会肿瘤学护理的以下临床启示。首先,有效的信息沟通是心理社会肿瘤学护理的关键组成部分,需要多学科方法和整合的信息干预,如在线同伴小组、媒体推送和基于GenAI的聊天机器人/人工智能代理,以提供及时和可访问的建议。具体而言,GenAI可作为支持服务的工具(Gage-Bouchard et al., 2017;Warner et al., 2020)。基于GenAI的聊天机器人需要进一步根据心理社会肿瘤学咨询、支持对话和实践指南进行微调和训练。此外,应设计一个基于验证知识库并结合检索增强生成(RAG)的AI代理,以提供心理社会肿瘤学护理的可行解决方案。该AI代理在幸存者和专业人员需要时扮演心理社会评估、支持和随访的角色。经过特定心理社会肿瘤学培训的AI代理将扩展大型语言模型(LLM)的记忆和上下文,提供明确的资源支持范围,避免虚假信息或模型幻觉的风险。
医疗专业人员被建议利用微信和红笔记的推广,嵌入不同人群的官方在线小组,以基于循证指南提供心理社会信息。此外,与关键意见领袖(KOL)合作推广心理社会肿瘤学信息是新兴趋势,应予以考虑。例如,被称为“Mediastorm”或“DaWuShiYe”的KOL积极与几家中国医疗机构合作进行社会教育,如揭示手术过程。这有助于缓解人力资源限制,并提供可靠的信息和帮助。
其次,尽管GenAI显示出将幸存者和专业人员与定制资源连接的潜力,但应实施混合护理模式,以确保伦理规范和人类监督(Bires et al., 2025;Chen et al., 2024)。由于敏感对话、伦理考量和临床决策不能完全由GenAI或AI代理取代,应设计一个在线数据库或云基础设施,以收集、存储和分析由心理社会肿瘤学特定GenAI工具处理的伦理敏感数据(Walter et al., 2023)。在专业监督下的混合模型,整合GenAI应用和云平台,对于为幸存者和专业人员提供全面的评估、支持和信息至关重要。这些解决方案确保了GenAI的效率和专业人员的专长的整合,促进了癌症幸存者心理社会肿瘤学护理的可访问性、转介路径和连续性。
第三,认识到人们对心理社会肿瘤学主题的多样化理解和意识非常重要。特别是,社交媒体和GenAI的内容呈现和互动方式在很大程度上塑造了癌症幸存者和专业人员如何与心理社会信息互动。增强公众对这些幸存者所面临心理社会脆弱性的认知也是必要的。需要批判性思维来筛选适用于特定情境或场景的心理社会信息。
本研究的成果展示了STM在分析社交媒体和GenAI上心理社会肿瘤学信息的潜力,但同时也揭示了这些方法的局限性。社交媒体上的信息更偏向于深入和具体,而GenAI的分析过程则更加自动化,尽管提高了效率,但降低了透明度。此外,GenAI的数据收集基于九个标准化提示,这可能限制了研究结果的全面性,从而影响了对背景多样受众的解释。最后,所选的社交媒体特定于中国,这为发展中国家或中低收入国家的心理社会肿瘤学信息提供了见解,但限制了研究结果在心理社会肿瘤学实践更成熟的地区的普遍性。尽管社交媒体和GenAI在整合心理社会肿瘤学护理元素方面有所进展,包括心理健康支持、专业人员和幸存者的教育等,但这些工具在心理社会肿瘤学护理中的应用仍处于早期阶段。因此,未来的研究需要评估这些工具在长期、严谨和普遍性方面对专业人员和幸存者心理社会肿瘤学护理的适用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号