中文题名: | 基于深度神经网络的手指动态交互识别 |
姓名: | |
保密级别: | 公开 |
论文语种: | 中文 |
学科代码: | 070101 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2019 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
提交日期: | 2019-05-27 |
答辩日期: | 2019-05-20 |
中文关键词: | |
中文摘要: |
人机交互在过去十年受到了热切的关注,最新的研究越来越倾向于自然系统的交互例如手势识别。手势识别渐渐由传统的模式识别变为近些年运用机器学习进行识别。我们可以将手势识别过程拆分成两个独立的过程,分别是图像处理和机器学习。
要对图像进行处理,首先需要获取图像。借用python强大的opencv库,我们可以自己创造一个手势数据库。本文借助kaggle平台的手势识别数据库。这组数据比较干净,共有10个手势,由5男5女摄制,每一个手势都含有2000张图片。数据获取完成后,需要对图像进行处理本文介绍了几种处理图像的方式。坐标转化主要是对三维图像进行转化,使得手势图像能够正对摄像机,提升图像的品质,增加预测精度。图像分割主要是将二维图像中的手势及背景分割开来。对于静态图像,我们采取阈值分割的方式,肤色的RGB数值与背景的RGB数值显然不同。我们可以选择一个合理的阈值将背景全部去除。对于动态图像,我们对运动的相邻图像做差分。不变的部分为背景,做差后可以消除,变化的部分为手势,可以保留。也完成了对手势的分割。
图像处理后开始搭建神经网络模型。采用后向传播的方式选择模型的节点和权重。该模型表现很棒,在测试集中的正确率能接近100%。
﹀
|
参考文献总数: | 6 |
馆藏号: | 本070101/19110 |
开放日期: | 2020-07-09 |