《Health Communication》:A Match Made in Language: Examining the Role of Linguistic Similarity in Adolescents’ Preference for Persuasive Health Messages in Social Media Contexts
摘要
在社交媒体上吸引青少年关注健康话题是一项公认的挑战。常见的策略是信息个性化,但多数努力集中于个性化“说什么”而非“如何表达”。这无疑是一个遗憾,因为与青年相关的健康传播需要同时关注风格和内容。数字传播环境通过使用户的语言模式可见并可用于个性化,使得这种适应成为可能。然而,关于青少年如何回应以类似语言风格撰写的健康信息,或者这种相似性如何最佳地操作化,我们知之甚少。为填补这些空白,这项预先注册的研究检验了青少年是否更喜欢与其语言风格更相似的社交媒体健康信息,并确定了哪些语言类别最能引发积极反应。研究利用191名荷兰青少年(13-15岁)捐赠的WhatsApp对话,推导出语言特征,并创建了在语言相似性上存在差异的Instagram风格健康信息。参与者随后评估了22对信息,每对信息操纵一个语言类别。多水平贝叶斯分析为语言相似性对信息偏好或个性化的影响提供了不明确的证据,并为语言相似性对感知有效性的影响提供了中等程度的反对证据。我们的研究结果指出了实验透明度和相似性强度之间的潜在权衡,为完善未来的操作化提供了重要见解。同时,青少年 consistently preferred positive and simple-worded messages,这为在社交媒体上进行更具吸引力的健康传播提供了一般性的风格指导。此外,我们还讨论了对基于人工智能的风格匹配的启示,包括算法方法和大语言模型的使用。
引言
我们在社交媒体上进行的交流超越了内容的交换。它留下了我们个性、信念和沟通偏好的隐性数字痕迹。这些个人信息并非主要编码于我们“谈论什么”,而更多地在于我们通过语言风格“如何表达自己”的方式。这包括我们如何选择词语(词汇特征)、如何构建句子(例如,句法特征),或者我们使用的复杂度和正式程度。研究人员创造了术语“语言指纹”或“风格组”来描述这些独特的语言模式。风格计量学研究不仅利用这些语言指纹来识别匿名文本的作者,还将其作为窥探个体心理的窗口。例如,语言风格已被成功用于高精度预测人格特质、情绪状态和个体的认知加工风格。
语言风格不仅反映个体的心理特征,还塑造人际动态,特别是通过 signaling similarity between people。根据相似-吸引理论,个体会与那些他们认为在心理上与自己相似的人建立更强的联系。例如,表现出更相似语言风格的人更有可能建立友谊、 initiate romantic relationships,并体验到更高的信任度。除了关系形成,感知相似性在数字说服中也可能发挥作用。例如,研究发现,在Reddit讨论中,强调共享经验和价值观的帖子(即所谓的相似性诉求)是最有效的说服策略之一。这种感知相似性的说服优势可能源于对信息源更有利的感知,例如增加的好感度和信任度,以及对信息本身更易接受的加工。例如,来自相似他人的说服性信息被评为更有帮助,同时触发更少的心理抗拒。
语言相似性作为健康传播的工具
在健康传播中,个性化策略通常用于建立与受众的感知相似性并改善健康结果。主导方法是基于内容的定制,即调整信息内容以与接收者的人口统计学特征、文化背景或心理特征保持一致。此类策略已成为健康运动的基石,并与提高信息相关性和有效性相关。然而,基于内容的定制也带来了伦理和实践上的挑战。它通常需要大量跟踪用户数据,这会带来隐私风险,并且如果被认为过于侵入性,可能会引发抗拒。此外,社交媒体数据访问限制日益增多,进一步限制了基于内容的个性化的可行性。这些挑战共同凸显了在数字健康传播中需要替代性定制策略。
因此,一个很有前景的替代方案是语言定制,其旨在通过语言手段创造相似性感知。与适应人口统计或心理类别的基于内容的定制不同,语言定制侧重于信息的表达方式。它调整风格特征,如词语选择、语调或句法模式,以与接收者的自然沟通风格保持一致。先前的研究表明,语言风格可能非常适合个性化,因为它是独特的且在时间上相对稳定。因此,它可以作为心理特质的代理,而无需直接跟踪或揭示它们。
语言定制的早期发现在数字传播环境中指向了一些积极的沟通结果。例如,匹配用户语言风格的对话代理被认为更具吸引力、更值得信赖,并且是更顺畅的沟通者。这对青少年尤其相关,因为他们的数字沟通风格与成年人明显不同。然而,关于语言定制的研究仍然有些零散。大多数研究侧重于个别类别,如情感效价、可读性或正式性。相比之下,更自动化的方法整体性地模仿多个类别,但功能如同“黑箱”,对其驱动效果的特征提供很少的见解。因此,哪些语言特征对有效的健康传播最相关仍不清楚,这强调了对比较研究的需求。我们旨在通过系统比较多个语言类别来弥补这一空白,以确定哪些类别可以为风格化个性化的健康运动提供信息。
本研究
这项预先注册的实验检验了更高的语言相似性是否会增强青少年对健康信息的偏好。利用从191名青少年捐赠的WhatsApp数据,我们设计了Instagram风格的健康信息,这些信息在22个语言类别上系统地变化语言相似性。为提高生态效度,信息被呈现为来自一位未具名的网红。这种设置反映了青少年社交媒体环境中的一个常见情境,即他们遇到来自不熟悉的内容创建者的说服性(健康)信息。我们在植物基饮食领域测试这种效应,这是一个在青年中相关且具有争议性的话题,也是健康相关Instagram内容中的常见主题。
为评估对语言相似健康信息的偏好,我们系统测试并比较了22个语言类别。这些类别包括心理语言学类别(例如,情绪、动机状态、认知风格)和形式语言学类别(例如,复杂性、正式性、简洁性)。通过采用这种逐步方法,我们旨在获得关于特定语言类别如何影响相似性和说服力的细致见解。在此过程中,我们旨在为未来的风格匹配健康干预措施奠定证据基础。作为说服成功的指标,我们使用信息偏好(即喜欢程度),这是在数字传播情境中一个公认的说服前因。
假设1:与语言风格相似度较低的健康信息相比,青少年将更喜欢与其语言风格更匹配的健康信息。
除了评估信息偏好,我们还旨在增进对语言定制潜在机制的理解。基于内容定制的研究 consistently identified perceived personalization as a key mediator of tailoring effects。感知个性化反映了接收者 consciously feel that a message is designed for them 的程度,这增加了相关性、注意力和说服力 impact。在基于内容的方法中,这种感知通常通过明确的语义线索触发,例如引用个人兴趣、人口统计特征或个人偏好,这使得个性化易于识别。虽然语言定制通过风格而非语义对齐来运作,它可能通过类似的路径影响个性化。当青少年注意到一条信息“听起来像他们自己”时,这种感知到的风格相似性可能 similarly trigger personalization effect。然而,语言相似性是否会产生这种有意识的感知,或者其效果是否更内隐地运作,仍不清楚。为解决这一概念区分,我们因此测试了一个更具针对性的构念:感知风格相似性,定义为接收者感觉信息反映其在社交媒体上自身沟通方式的程度。
假设2:参与者社交媒体信息与偏好的健康信息之间的语言相似性越大,健康信息的感知风格相似性越高。
第二个感兴趣的机制是感知信息有效性,它捕捉了个体对一条信息感觉有多令人信服、有影响力或有说服力的判断。由于许多健康传播研究无法直接测量行为结果,感知信息有效性被广泛用作实际说服影响力的有效代理。因此,感知有效性使我们能够测试特定语言类别的风格对齐是否增强了健康信息的说服潜力。
假设3:参与者社交媒体信息与偏好的健康信息之间的语言相似性越大,健康信息的感知有效性越高。
除了验证性假设,我们还进行了一项探索性分析,以检验语言相似性是否与信息源和接收者之间的感知相似性相关。先前的研究表明,风格或语言对齐可以促进人际亲密感或共享认同感。这项分析是探索性的,因为在我们的被试内设计中,青少年同时观看了相似度较高和较低的信息变体。因此,我们测试了在这些配对中选择更相似的信息是否与更高的感知源相似性相关。尽管这不构成一个干净的实验操纵,但它提供了关于风格对齐是否与源相似性感知相一致的初步见解。
方法
参与者
数据于2023年夏季至2024年秋季在荷兰的四所中学收集。我们以早期青少年(13-15岁)为目标群体,这个时期独特的语言风格开始出现,并且对在线影响的易感性增加。所有学生都参加了一个带有可选研究部分的社交媒体素养项目。参与是自愿的,并获得了青少年和家长的积极同意。
事前功效分析表明,需要175名参与者才能以80%的效力检测到小效应。在接触的634名家长中,404人给予了许可,191名青少年(47%为女孩;平均年龄MAge= 14.29,标准差SD = 2.34)完成了研究。这个参与率(约30%)与之前的数据捐赠研究相当或更高。为每位参与者,向由青少年选择的慈善机构捐赠了5欧元(“为捐赠而捐赠”)。
设计
我们的实验设计使用了一个二分信息选择任务,其中青少年评估了22对推广植物基食品选项的信息。每对信息对应22个语言类别中的一个。信息在内容和长度上相同,但在目标类别内的语言风格上有所不同。在每对中,一条信息作为基线(在类别上得分低),另一条被操纵为得分高。青少年为每对信息表明他们的偏好(见图1)。两条信息都类似于Instagram帖子,来源是一位未知的虚构网红,反映了典型的CMC影响情境。这项研究在OSF上进行了预注册(链接)。
材料与刺激物
语言特征选择: 为我们的分析,我们从LIWC-22评分工具中选择了22个心理语言学类别(例如,情绪、动机状态、认知风格)和形式语言学类别(例如,复杂性、正式性、简洁性)。选择这些类别是因为它们捕捉了青少年沟通方式的心理意义层面,并且与在定制信息中操作化风格相似性直接相关。相比之下,许多其他LIWC类别主要衡量语义内容(例如,生物过程、休闲、家庭)而非风格,这会将风格相似性与主题相似性混淆。其他类别捕捉微观层面的功能词使用(例如,代词、副词),这些只有在作为更广泛的风格模式集体分析时才有信息量,而不是作为孤立特征。由于本研究检查了特定类别的相似性操纵,包含此类微观层面的类别会引入不必要的噪音,并对哪些风格特征对定制最有效提供有限的见解。
刺激信息: 一组初始的健康信息由青年健康传播领域的研究人员起草,并进行了年龄适宜性审查。为创建基线和实验版本,我们使用LIWC-22作为工具来量化我们的操纵并使其在语言类别间保持恒定。对于22个类别中的每一个,编写了得分低(< 5.00)的基线信息,而实验版本则通过插入相关LIWC词典中的四个代表性词语被操纵为在该类别上得分高(> 14.00)(例如,对于“积极情绪”类别,我们使用了“happy,” “loved,” “fun,” and “relaxing”;图1)。除了这种操纵,内容、结构和长度(±3个词)在信息对之间保持恒定。信息首先用英语开发,用LIWC-22验证,然后翻译成荷兰语。翻译使用荷兰语LIWC2015词典重新验证,并根据需要进行微调。最终的荷兰语信息及其得分可在补充材料中找到。
数据捐赠工具与处理: 为建立基线语言分数,要求青少年捐赠最多五个与同学的WhatsApp聊天记录。他们被指导如何直接从WhatsApp导出聊天记录,这意味着每段聊天记录都是完整捐赠的,从对话开始到最近的信息。参与者然后将这些完整的聊天记录导出文件上传到定制版的PORT软件,该软件应用隐私设计原则并在GitHub上可用(链接)。仅保留捐赠者的信息,而伙伴的信息、视觉内容(例如,图片、视频)和可识别信息(例如,姓名、日期、地点)被自动移除并替换为标记(例如,[NAME], [DATE])。捐赠者可以在最终提交前手动审查和删除个别信息。此程序获得了伊拉斯谟大学鹿特丹伦理委员会的批准(ETH2324-0109)。数据捐赠平均每位参与者产生8117个词(中位数Mdn = 3,319,标准差SD = 23,663;范围 = 23–300,000词)。由于非常短的样本会损害语言分析的可靠性,我们应用了100个词的门槛,这是为大多数选定的语言类别产生有效LIWC分数所需的最低要求。
语言分析准备: 捐赠的文本首先使用Pyspellchecker进行拼写检查,并使用DeepL从荷兰语翻译成英语。保留停用词,因为它们是语言风格不可或缺的一部分。我们使用LIWC-22和TextBlob(用于类别“主观性”)来量化语言风格。相似性分数是通过比较参与者的文本特征与两个信息变体来计算的。我们最初选择了20个与风格相关的LIWC类别,侧重于心理维度(例如,情绪、认知、动机)和结构特征(例如,词长、正式性),而不是基于内容的类别。添加了两个额外的非LIWC变量(主观性和强度),最终得到22个类别。初步分析显示,七个类别(例如,“缺乏”、“风险”、“疲劳”、“需求”和主观性)的流行度极低(< 0.5%的词),在LIWC中产生许多空值。此外,“每句词数”被证明不可靠,因为青少年经常不一致地使用标点符号。这些类别被排除,产生最终14个语言类别的集合(表1)。
程序
获得同意的青少年在连续三天内参与。第一天,他们通过PORT平台选择和导出WhatsApp聊天记录,数据在那里被匿名化,并完成了一个简短的人口统计调查(年龄、性别、家庭富裕程度)。第二天和第三天,参与者完成了信息选择任务,每天评估11对Instagram风格的信息对(共22对),涵盖语言类别。对于每对信息,他们表明自己的偏好,并回答关于所选信息的后续问题。在最后一天,参与者接受简报、致谢,并被要求投票决定5欧元参与捐款将分配给哪个慈善机构。
测量
语言相似性: 我们计算了相似性分数来评估参与者语言风格与实验信息(H1)或其偏好信息(H2, H3)的匹配程度。使用了跨类别的LIWC分数(0-100量表),TextBlob提供的主观性分数转换为相同量表。相似性是通过比较青少年捐赠的文本特征与信息分数来计算的:绝对差值从100中减去,因此更高的值表示更大的相似性(100 = 完美匹配)。对于H1,该语言相似性分数是相对于实验信息计算的(M = 87.26, SD = 4.05)。对于H2和H3,该分数是相对于选择的偏好信息计算的(M = 92.53, SD = 6.33)。
信息偏好: 信息偏好通过基线和实验变体之间的二分选择来评估。两者以随机顺序并排显示,参与者表明他们更愿意在社交媒体上给哪个“点赞”(“想象你在社交媒体信息流中遇到这些信息。你更愿意给哪条信息‘点赞’?”;0 = 基线,1 = 实验)。
感知信息有效性(PME): 感知信息有效性(PME)仅针对参与者偏好的信息进行评估。参与者回答项目:“你在多大程度上同意以下陈述:这条帖子让我想吃更多这种植物基产品。”回答采用6点李克特量表(1 = 非常不同意,6 = 非常同意;M = 2.67, SD = 1.49)。
感知风格相似性(PSS): 感知风格相似性仅针对偏好的信息进行评估,使用改编自感知个性化量表的项目:“你在多大程度上同意以下陈述?这条帖子的写作方式与我自己在社交媒体上写帖子的方式相似。”回答采用6点李克特量表(1 = 非常不同意,6 = 非常同意;M = 2.77, SD = 1.45)。
感知源相似性: 感知源相似性在研究结束时用两个项目测量一次(例如,“你现在已经在Instagram上看到了一位美食博主的几条帖子。[…] 帖子背后的人和我非常相似。”)。回答采用6点李克特量表(1 = 非常不同意,6 = 非常同意;M = 2.31, SD = 1.22)。
控制变量: 由于说服效应可能与参与者的人口统计学特征相关,我们控制了年龄(以月计)、性别和家庭富裕程度。
数据分析计划: 我们使用多水平回归模型测试了三个预先注册的假设。假设1使用混合效应逻辑回归进行评估,通过所有14个类别的语言相似性预测二元信息偏好。假设2和3分别使用混合效应线性回归进行测试,以感知风格相似性和感知有效性作为结果。后验结果在附录A(表A1–A3)中提供。我们还使用贝叶斯回归模型探索了对感知源相似性的影响。所有分析均在Python中使用bambi进行。性别作为控制变量被纳入,因为它改善了模型拟合。使用贝叶斯推断来评估证据强度。模型拟合通过留一法交叉验证(LOO)进行评估,贝叶斯因子(BF)比较了包含和不包含预测变量的模型。遵循Wagenmakers等人的指南解释贝叶斯因子,BF10> 3被解释为对假设的中等证据,BF10< 1/3被解释为对零假设的中等证据,值在1/3和3之间为不明确。分析代码可在GitHub上找到(链接)。
结果
描述性分析
为了探索青少年的信息偏好,我们按实验信息被选择超过中性基线的频率对14个语言类别进行了排名(表1,图2)。青少年普遍偏爱使用积极效价语言的健康信息。五个最受偏爱的风格中有四个反映了积极效价:驱动力(65%偏好)、奖励(59%)、积极语调(55%)和积极情绪(53%)。相比之下,最不受偏爱的风格包括消极效价(消极情绪、消极语调)和语言复杂性(大词,定义为>6个字母)。例如,只有27%的参与者偏爱带有消极情绪语调的信息,24%偏爱那些词汇复杂的信息。这些发现表明,青少年不仅偏爱积极效价的语言,而且在与中性基线信息比较时,倾向于拒绝带有消极语调或较高语言复杂性的信息。
假设1:语言相似性对信息偏好的影响
为了检验我们的第一个假设,即青少年将更喜欢与其语言风格更匹配的健康信息,我们使用了一个以语言相似性为主要预测因子的贝叶斯混合效应逻辑回归模型。将该模型与一个排除相似性但包含所有控制变量以及参与者和语言类别的随机截距的零模型进行比较。这使我们能够解释每位参与者的重复信息暴露以及跨语言类别的基线变异。描述性统计显示,青少年对偏好信息变体的语言相似性(M = 92.53, SD = 6.33)仅比对不太偏好变体(M = 91.37, SD = 6.30)的最小程度更高。这表明没有明显的选择语言上更相似信息的倾向。此外,包含语言相似性的模型显示出稍好的预测性能(ΔELPD = 0.54, SE = 0.78),尽管差异很小。相应的贝叶斯因子为1.7,落在不明确范围内(1/3–3;Wagenmakers等人),这意味着数据没有明确支持语言相似性对信息偏好存在或不存在影响。与此一致,语言相似性的后验估计接近零(M = 0.02, SE = 0.02, 97% CI [?0.02, 0.07])。因此,我们第一个假设的证据是不明确的。此外,一些语言类别独立于定制,显著正向预测信息偏好(驱动力、积极情绪、奖励),而其他类别则负向预测(消极语调、消极情绪、大词、好奇心)(见附录A,表A1)。
假设2:语言相似性对感知风格相似性的影响
为了解决我们的第二个假设,即参与者的社交媒体信息与其偏好的健康信息之间更大的语言相似性将预测更高的感知风格相似性,我们运行了一个贝叶斯混合效应回归模型。包含相似性的模型仅比零模型表现稍好(ΔELPD = 0.49, SE = 1.14;BF10≈ 1.6),这落在不明确范围内(1/3–3;Wagenmakers等人),意味着数据没有明确支持存在或不存在效应。后验估计实际上为零(M = 0.00, SE = 0.01, 97% CI [?0.01, 0.01])。因此,H2未得到支持,并且没有单个语言类别显著预测感知风格相似性。
假设3:语言相似性对感知信息有效性的影响
为了解决我们的第三个假设,即参与者的社交媒体信息与其偏好的健康信息之间更大的语言相似性将预测更高的感知有效性,我们运行了一个贝叶斯混合效应回归模型。包含相似性的模型比零模型表现稍差(ΔELPD = ?1.10, SE = 1.26)。贝叶斯因子BF10= 0.33表明零模型大约是假设模型可能性的三倍。该值正好位于通常解释为对零假设有中等证据的常规阈值(BF10< 1/3;Wagenmakers等人)。这为语言相似性作为感知信息有效性的预测因子提供了中等程度的反对证据。后验估计接近零(M = 0.01, SE = 0.01, 97% CI [?0.01, 0.03])。因此,我们的第三个假设未得到支持,并且没有证据表明任何特定的语言类别预测感知信息有效性。
探索性分析
效价在信息偏好中的作用: 鉴于主要分析的不明确结果,我们探索了信息效价是否在青少年偏好中发挥了更强的作用。描述性统计表明,积极效价类别通常比消极效价类别更受偏爱。为了检验这一点,我们将14个类别分为三个效价簇:消极(消极情绪、消极语调、需求)、积极(积极情绪、积极语调、驱动力、奖励、吸引力、强度)和中性(认知、社交、大词、对话语调)。然后,我们以效价作为预测因子重新运行了贝叶斯多水平逻辑回归。该模型的性能与零模型相当(ΔELPD = ?0.22, SE = 0