使用YOLOv8和Tesseract-OCR深度学习进行简历内容识别

《The Computer Journal》:CV content recognition using YOLOv8 and Tesseract-OCR deep learning

【字体: 时间:2025年10月28日 来源:The Computer Journal

编辑推荐:

  简历智能筛选系统通过YOLO目标检测定位关键模块,结合Tesseract-OCR实现多格式简历文本提取,运用遗传算法优化模型参数,并构建数据库支持高效检索与分析。实验在1300份多语言、多质量格式的简历数据集上验证,平均精度达92.1%,召回率86.0%,显著提升招聘效率。

  

摘要

由于就业市场中简历的数量和种类不断增加,需要更高效的排序算法。从大量候选人中筛选出适合职位的空缺职位既繁琐又耗时,这可能导致错失机会或因人为错误而产生偏见。为了解决这一挑战,本研究提出了一种新颖的简历识别系统,该系统整合了多项先进技术:使用“You Only Look Once”技术检测简历中的关键部分,通过Tesseract-OCR技术从这些部分提取文本,并通过一系列后处理步骤纠正文本识别错误。此外,该系统还包括一个自动化的数据组织组件,用于将简历信息存储在数据库中,从而便于数据分析和搜索操作。系统使用了一个包含1300份简历的公共数据集进行评估,这些简历格式包括JPEG、PNG和JPG,来源多样,涵盖了不同的格式、语言和质量水平。在数据预处理阶段确保了数据的一致性和质量。模型的超参数通过遗传算法进行了优化。所提出的系统显著提高了简历排序的效率和准确性,使人力资源团队能够专注于战略任务并简化招聘流程。实验结果表明,该系统的有效性很高,平均精确度达到了92.1%,精确率为92.2%,召回率为86.0%。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号