现代汉译文学编年考录数据库(1896-1949)：数字人文视角下翻译文献的跨学科重构

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Digital Scholarship in the Humanities》：A bibliographic database of Chinese translations of foreign literature in modern periodicals (1896–1949)

【字体：大中小】 时间：2025年11月15日 来源：Digital Scholarship in the Humanities

编辑推荐：

　　本刊推荐：为解决晚清至民国时期汉译外国文学(CTFL)中普遍存在的“同实异名”检索难题，研究团队融合古典目录学方法与Python、Elasticsearch等数字技术，构建了涵盖226种期刊的《现代汉译文学编年考录数据库》。该数据库通过标准化作者译名、译者笔名及作品题名，实现了跨语言关联检索与多维可视化分析，不仅解决了长期困扰学界的史料检索障碍，更为翻译文学史、跨文化传播研究提供了基础设施与创新方法论。

在晚清至民国（1896-1949）这一中国近代思想激荡的时期，外国文学译介成为知识分子“向西方寻找真理”的重要途径。然而，这段翻译热潮留下的文献遗产却长期陷于“同实异名”的泥沼——同一外国作家被译作多个不同姓名（如雪莱有解莱、许丽等6种译名），译者笔名更迭频繁（如周作人使用萍云、碧罗女士等十余个笔名），作品题名亦常遭本土化改写（如《简·爱》被译为《重光记》《孤女飘零记》）。这种混乱使得传统期刊目录与现有数据库难以有效检索，大量重要译者（如胡仲持）与作品被历史尘埃掩盖，甚至导致学术误判（如《空谷佳人》长期被误归为林纾译作）。

为破解这一难题，广东海洋大学与中国人民大学的研究团队联合中华书局旗下古联数字传媒科技有限公司，历时十年打造了《现代汉译文学编年考录数据库》。研究以古典目录学“目录”体系为方法论核心：通过“目”的编年与分类整理，系统辑录翻译作品、理论批评及译者序跋；借助“录”的考据与注解功能，对每位原作者、译者及文本进行跨语言溯源与标准化处理。团队更引入Python正则表达式与Beautiful Soup库实现元数据自动提取，利用Elasticsearch引擎构建关联检索系统，最终形成支持多维检索、可视化分析与全文对照的专题数据库。

4.1 跨语言文本溯源与译者笔名考订

研究通过比对原始期刊、译者序跋及既有考据成果，成功还原了10,000余条译作的原始信息。例如，《新新小说》所载《血之花》经考证实为司各特《苏格兰史祖孙记》的节译；而《苏联文艺》中译者陈冰夷的笔名从已知3个扩展至管弦、司竹等16个。此类考订不仅纠正了历史误读，更揭示了译者群体复杂的文化身份策略。

4.2 传记资料的系统整合

数据库收录了1,580位外国作者与2,130位译者的生平资料，规模远超《中国翻译家词典》。针对争议人物（如译者奚若的生卒年），团队通过多源史料互证（如《进步》杂志讣告）实现精准定年，并为存疑案例标注多元说法，体现学术透明度。

5.1 技术架构与功能创新

数据库采用MySQL存储结构化数据，通过Elasticsearch实现“同实异名”关联检索（如输入“鲁迅”可联动检索其庚辰、索子等所有笔名）。前端设计支持按时间、国别、文体等字段的分类阅读模式，辅以点击式辅助阅读（如点击译者“曾广铨”可弹出生平简介）及原刊图像对照功能，显著提升研究效率。

5.2 学术范式突破

该平台突破了传统翻译史研究的“大家中心”叙事，通过平等呈现每部译作细节，使边缘译者（如甘永龙）与次要作品（如莫泊桑早期译介）得以进入学术视野。定量分析表明，杰克·伦敦作品早在1919年即由《少年中国》译介，较既有定论提前两年，修正了文学传播史的关键节点。

该数据库的建成标志着中国翻译文献研究正式进入“数字考据”时代。其核心价值在于将散乱的史料转化为可计算、可关联的结构化知识，为重构翻译文学谱系、分析跨文化接受机制提供了方法论范式。目前已有300余所高校订阅使用，相关成果助力了海外华文文学（如张松建对苗秀的研究）等跨领域探索。未来，团队计划扩展期刊覆盖范围，并依托用户纠错机制持续优化数据精度，推动数字人文与文献学的深度交融。

联系信箱：

粤ICP备09063491号

4.1 跨语言文本溯源与译者笔名考订

4.2 传记资料的系统整合

5.1 技术架构与功能创新

5.2 学术范式突破

热点排行