中文题名: | 基于PaddleOCR的模型评测及应用研究 |
姓名: | |
保密级别: | 公开 |
论文语种: | 中文 |
学科代码: | 070101 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2021 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
提交日期: | 2021-05-18 |
答辩日期: | 2021-05-18 |
中文关键词: | 深度学习 ; 光学字符识别(OCR) ; PaddleOCR ; 图像处理 ; 软件部署 |
中文摘要: |
本文利用百度开源的PaddleOCR工具集的PP-OCR中英文超轻量OCR预测推理模型、预训练模型,对其内置的与常用的已公开的数据集进行文字检测与识别测评,认为这款开源的OCR工具集中内置的已训练完成的PP-OCR中英文超轻量OCR推理模型具备较好的泛化能力,适合一般用户用于非特殊情况下的场景文字识别;对于具有特定需求的用户,可以使用大量图片数据并调整参数对预训练模型进行训练,进而使得该OCR系统对这一类的数据集获得更高的检出率与识别准确率;对于OCR系统开发者,PaddleOCR提供了比较方便快捷的C++部署方式,相比于Python脚本能够极大地提升检测与识别速度。基于深度学习的原理,本文通过改变模型训练的相关参数如batch size和学习率等,使用新的训练集对预训练模型中的文字识别模块进行训练,并尝试寻找最佳参数以提升模型的训练效率与识别性能;最后,本文将Python编写的独立OCR工具库接入C++程序,通过一个MFC窗口应用程序来调用OCR工具库进行交互式文字识别,作为帮助拓宽其应用场景的一个实例。
﹀
|
参考文献总数: | 5 |
插图总数: | 0 |
插表总数: | 0 |
馆藏号: | 本070101/21043 |
开放日期: | 2022-05-18 |