基于改进的 YOLOv8 文档图像文字检测研究

余 承翔(南京理工大学自动化学院,中国)

DOI: http://dx.doi.org/10.12349/iser.v5i12.4058

Article ID: 4058

摘要


论文提出了一种基于YOLOv8添加CA注意力机制的文字检测算法。为了应对文档图像的档案数字化检测识别过程中手写体和印刷体无法较好区分的问题,论文分析了YOLOv8目标检测算法,指出了现有的目标检测算法在纸质文档文字检测的过程中可能产生的印刷体与手写体类别的误差,在实际档案图像数字化的自动著录的应用中,手写体的识别难度相较印刷体大,需要区别单独识别,论文提出了一种添加CA注意力机制的改进的检测算法,论文主要针对表格类型的文档图像采用文字检测算法,实验结果表明,该文字检测算法能够有效提高文档图像的印刷体和手写体的分类精度,满足工程应用的要求。

关键词


档案数字化;文本检测;YOLOv8;CA注意力机制

全文:

PDF

参考


冯少贤.基于深度学习的OCR检测与识别技术研究[D].北京:北方工业大学,2023.

牛旭.面向手写档案数字化的汉字分类与识别研究[D].郑州:中原工学院,2022.

韩强.面向小目标检测的改进YOLOv8算法研究[D].吉林:吉林大学,2023.

马明扬,宋淑彩,赵一航,等.基于YOLOv8的车辆类型识别研究[J].河北建筑工程学院学报,2024,42(1):247-252.

Yu X, Liu J, Lu Y, et al. Early diagnosis of Alzheimer’s disease using a group self-calibrated coordinate attention network based on multimodal MRI[J]. Scientific Reports,2024,14(1):24210-24213.


Refbacks

  • 当前没有refback。


版权所有(c)2025 余 承翔

Creative Commons License
此作品已接受知识共享署名-非商业性使用 4.0国际许可协议的许可。