华盛顿大学的研究人员开发了PaperTok,这是一个人工智能系统,可以帮助用户将研究论文转换成简短、引人入胜的视频。

【字体: 时间:2026年06月27日 来源:AAAS

编辑推荐:

  华盛顿大学的一个团队开发了一款人工智能工具,可以帮助用户将研究论文转换成 45 秒的视频。研究人员将论文上传到该工具,工具会使用 Google Gemini 生成一段简短的脚本来解释论文内容。之后,研究人员可以反复编辑脚本和生成的视频片段。

  

最近,华盛顿大学亲社会计算小组的学生们注意到社交媒体上出现了一种趋势:人们正在利用生成式人工智能制作短科学视频。问题在于,这些人并非科学家,而人工智能又极易出错,这可能会加速错误信息的传播。因此,该实验室开始思考如何帮助科学家和其他研究人员更好地适应TikTok等平台。 

“另一种情况是,人们在没有科学家的情况下谈论科学,”共同第一作者、华盛顿大学以人为本设计与工程专业的博士生梅齐亚·鲁比·克里斯托瓦尔说道。

这些讨论促使团队开发了PaperTok,这是一款人工智能工具,可以帮助用户将研究论文转化为 45 秒的视频。研究人员将论文上传到该工具,它会使用 Google Gemini 生成一段简短的脚本来解释论文内容。之后,研究人员可以反复编辑脚本和生成的视频片段。

该团队于 4 月 17 日在巴塞罗那举行的美国计算机协会人机交互系统会议上展示了他们的研究成果。

“由于种种原因,大多数人都不读研究论文,”资深作者、华盛顿大学以人为本设计与工程学教授谢嘉瑞(Gary Hsieh)说。“即使是我,阅读我不熟悉领域的论文仍然会遇到困难。因此,我们希望找到一种方法,能够快速地将论文转换成普通人愿意阅读的形式,并研究他们是如何阅读的。”

目前,PaperTok 仅对付费订阅 Google Gemini 的用户开放。这些用户可以访问PaperTok 网站并上传研究论文。系统随后会提供四个选项,供用户在视频中用作引子。例如,PaperTok 上关于自身平台的视频开头会这样写道:“你是否曾因阅读晦涩难懂的学术论文而感到不知所措?”

“首先,我们采访了八位科学传播者和内容制作人,了解如何制作引人入胜、可信的视频,”论文共同第一作者、华盛顿大学以人为本设计与工程专业的博士生申东勋(音译)说道。“我们发现,吸引眼球的开头对于短视频至关重要。因为你要和其他在线视频竞争,你只有几秒钟的时间来抓住观众的注意力。”  

选定主题后,PaperTok 会生成一个脚本,用户可以对其进行编辑。在故事板阶段,脚本会被拆分成多个场景——就像电影故事板一样。用户可以不断完善脚本并匹配相应的视频片段。当他们对最终成果满意后,可以添加署名,署名会与论文作者一起显示在文章末尾。 

研究团队邀请了100名在线参与者和18名学术参与者,将PaperTok生成的视频与另外两个PDF转视频生成器生成的视频进行比较。他们发现PaperTok易于使用,其视频也比其他系统生成的视频更具吸引力。但一些参与者担心,由于视频中会出现诸如无意义文本之类的AI痕迹,因此“人工智能痕迹太重”,他们不愿公开分享这些视频,因为这可能会降低其学术研究的可信度。 

该团队计划继续研究如何定制 AI 生成的视频,例如允许用户在场景的特定部分进行绘制,以便元素根据他们的意图而改变。 

“PaperTok 的主要动机是,‘我们如何才能帮助研究人员制作引人入胜的短视频?’”克里斯托瓦尔说。“因为借助生成式人工智能工具,任何人都能在几分钟内从 PDF 文件生成视频,但这会带来各种各样的问题——错误信息、人工智能生成的粗糙视频等等。所以我们希望开发一款能够让人们(最好是专家)参与其中的工具。我们希望 PaperTok 能够凸显出人在科学传播中的重要性。”

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号