基于语言模型的好莱坞电影对话纵向滥用与情感分析研究
《Machine Learning with Applications》:Longitudinal abuse and sentiment analysis of Hollywood movie dialogues using language models
【字体:
大
中
小
】
时间:2025年10月19日
来源:Machine Learning with Applications 4.9
编辑推荐:
本研究针对好莱坞电影中暴力与滥用内容日益增多的问题,采用自然语言处理(NLP)技术,对1950-2024年间奥斯卡提名及票房前十电影的对话进行纵向分析。研究人员利用微调的语言模型(包括RoBERTa和HateBERT)对千余部电影字幕进行情感分析和滥用检测,发现近二十年来电影中滥用内容显著增加,且奥斯卡提名电影的滥用内容已超越商业大片。该研究为理解电影内容演变及其社会文化影响提供了重要数据支持,对电影内容监管和观众引导具有指导意义。
在光影交织的银幕世界里,好莱坞电影不仅是娱乐的载体,更是社会文化的晴雨表。近年来,电影中暴力与滥用内容的增多引发了广泛关注,这些内容究竟如何随着时间推移而变化?其背后又反映了怎样的社会变迁?为了解答这些问题,研究人员开展了一项跨越七十五年的电影对话分析研究。
这项发表在《Machine Learning with Applications》上的研究,采用自然语言处理(NLP)技术对1950-2024年间的1026部好莱坞电影字幕进行了系统分析。研究团队选取了奥斯卡提名影片和年度票房前十的影片作为研究对象,将这些影片分为动作、喜剧、剧情和惊悚四大类别,以确保样本的代表性和全面性。
为了精准捕捉电影对话中的情感倾向和滥用内容,研究人员采用了多种先进的技术方法。首先,他们利用N-gram分析对电影字幕进行词频统计,识别不同年代的高频词汇和短语。其次,研究采用了基于Transformer的预训练语言模型,包括用于情感分析的RoBERTa模型和专门用于滥用内容检测的HateBERT模型。这些模型分别使用SenWave数据集(包含疫情期间的推特情感数据)和RAL-E数据集(来自Reddit的滥用语言数据)进行微调,以提高在电影对话分析中的准确性。此外,研究还采用了自然语言工具包(NLTK)进行文本预处理,包括去除停用词和特殊字符等操作。
研究结果揭示了电影对话中情感和滥用内容的显著变化趋势:
情感分析结果显示,幽默(joking)是电影中最常见的情感表达,其次是恼怒(annoyed)、悲伤(sad)、悲观(pessimistic)和乐观(optimistic)。不同电影类型的情感分布存在明显差异,剧情片中的悲伤情感比例最高,而动作片和惊悚片中相对较少。情感共现分析发现,幽默与恼怒情感经常同时出现,表明电影中常使用幽默来缓解紧张情绪。
通过情感权重分析发现,商业大片在1950年代、1980年代和1990年代的情感表达最为丰富,而奥斯卡提名影片自2020年以来情感丰富度显著提升。情感极性随时间呈现复杂波动,近几十年来整体呈现略微下降趋势,反映了当代电影更加复杂和黑暗的主题倾向。
在滥用内容检测方面,研究显示电影中的滥用内容自1980年代以来逐渐增加,并在2014年达到峰值。值得注意的是,奥斯卡提名影片中的滥用内容在近二十年内显著增加,自2010年起甚至超过了商业大片。这一变化可能反映了电影艺术对复杂社会议题的更多探索,也可能是电影商业化程度加深的表现。
不同类型电影的滥用内容分布也存在差异。动作片和剧情片中的滥用内容相对稳定且较低,而惊悚片在1950年代就表现出较高的滥用内容比例。商业动作片中的滥用词汇数量明显高于奥斯卡影片,这可能是因为商业片更注重营造刺激感和强烈情绪。
研究还通过具体案例分析了四部经典电影的情感变化轨迹。《无间道风云》的情感极性波动剧烈,滥用内容集中在影片中后段的高强度对话场景。《安妮·霍尔》整体保持积极情感基调,滥用内容零星出现。《沉默的羔羊》在95-105分钟处出现滥用内容高峰,与影片高潮段落相符。《烈火战车》几乎不包含滥用内容,情感极性峰值出现在比赛关键时刻,体现了体育精神主题。
该研究的讨论部分指出,电影情感的复杂化反映了社会事件的深远影响,如金融危机、气候变化和疫情等重大事件都促使电影表达更加多元的情感。同时,流媒体平台(OTT)的兴起可能加剧了电影中滥用内容的正常化趋势,因为OTT平台相对宽松的审查标准影响了内容创作方向。
研究人员也坦诚指出了本研究的局限性。首先,分析仅基于文本字幕,未能纳入视觉和音频等多模态信息,这可能会影响对暴力场景的全面理解。其次,用于模型微调的数据集主要来自当代社交媒体,可能无法准确反映历史时期语言使用的特点。此外,研究样本局限于英语电影,未能涵盖其他文化和语言背景的影片。
尽管存在这些限制,该研究仍为理解电影内容演变提供了重要见解。未来研究可以结合多模态分析方法,整合视觉、音频和文本信息,更全面地把握电影情感和暴力内容的表达。同时,扩大研究范围至不同文化背景的电影,将有助于揭示文化因素对电影内容的影响。
这项历时七十五年的电影对话分析,不仅揭示了好莱坞电影情感和滥用内容的变迁规律,更为理解电影与社会文化的互动关系提供了宝贵证据。随着人工智能技术的不断发展,此类研究将为电影内容创作、评级监管和观众引导带来新的启示,推动电影艺术与技术的深度融合。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号