- 无标题文档
查看论文信息

中文题名:

 基于PaddleOCR的模型评测及应用研究    

姓名:

 童儆磊    

保密级别:

 公开    

论文语种:

 中文    

学科代码:

 070101    

学科专业:

 数学与应用数学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2021    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 数学科学学院    

第一导师姓名:

 于濂    

第一导师单位:

 北京师范大学数学科学学院    

提交日期:

 2021-05-18    

答辩日期:

 2021-05-18    

中文关键词:

 深度学习 ; 光学字符识别(OCR) ; PaddleOCR ; 图像处理 ; 软件部署    

中文摘要:
本文利用百度开源的PaddleOCR工具集的PP-OCR中英文超轻量OCR预测推理模型、预训练模型,对其内置的与常用的已公开的数据集进行文字检测与识别测评,认为这款开源的OCR工具集中内置的已训练完成的PP-OCR中英文超轻量OCR推理模型具备较好的泛化能力,适合一般用户用于非特殊情况下的场景文字识别;对于具有特定需求的用户,可以使用大量图片数据并调整参数对预训练模型进行训练,进而使得该OCR系统对这一类的数据集获得更高的检出率与识别准确率;对于OCR系统开发者,PaddleOCR提供了比较方便快捷的C++部署方式,相比于Python脚本能够极大地提升检测与识别速度。基于深度学习的原理,本文通过改变模型训练的相关参数如batch size和学习率等,使用新的训练集对预训练模型中的文字识别模块进行训练,并尝试寻找最佳参数以提升模型的训练效率与识别性能;最后,本文将Python编写的独立OCR工具库接入C++程序,通过一个MFC窗口应用程序来调用OCR工具库进行交互式文字识别,作为帮助拓宽其应用场景的一个实例。
参考文献总数:

 5    

插图总数:

 0    

插表总数:

 0    

馆藏号:

 本070101/21043    

开放日期:

 2022-05-18    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式