一种基于深度图像的手势识别算法
2021-07-02
来源:品趣旅游知识分享网
第41卷第2期 22 2014年4月25日 数字通信 Vol 41.No.2 Apr.25 2014 Digital Communication DOI:10.3969/j.issn.1001—3824.2014.02.006 一种基于深度图像的手势识别算法 孟上,高陈强,杨璐毓 (重庆邮电大学信号与信息处理重庆市重点实验室,苇庆400065) 摘要:利用Kinect捕捉深度图像,使用有效的手势分割手段将手势区域截取并运用相关算法对手势进行轮廓、凸 包及其最小外接圆提取;然后构建了4种手势特性参数并给出了4种参数的计算方法;最后综合手势特性参数构 建分类决策树以实现手势识别。实验针对9种常见手势在复杂背景条件下进行测试,单个手势识别率在89%一 100%之间,综合识别率达到96%。 关键词:手势识别;Kinect传感器;人机交互 中图分类号:TP391.4 文献标识码:A 文章编号:1005.3824(2014)02-0022-05 0 引 言 手势识别在人机交互的发展过程中起着不可或 因素的影响,目前提出的识别方法都有各种缺点很 难在实际中应用。 为了能够克服上述缺点,本文提出了一种新的 缺的作用,是实现真正自然的人机交互的一个至关 重要的技术。该技术利用各类图像,使得机器能够 经过处理获得人类手势信息,进行相应的手势识别, 从而达到人机自然交互的目的。这项关键技术在人 基于深度图像的手势识别方法:首先利用有效的分 割算法分割手势区域,进而提取该区域轮廓、凸包及 其最小外接圆;然后计算手势特性参数;最后综合手 势特性参数构建分类决策树以实现手势识别。同 时,利用复杂背景条件下的9种常见手势真实数据 机交互领域应用十分广泛:如手术室、展示厅等不方 便使用外设输入设备的场合。由于巨大的应用前 景,手势识别成为目前研究的热点,出现了许多研究 方法,如杨波等针对复杂背景采用空问分布特征对 手势进行识别¨J,这种方法尽管在理想状态下识别 对该方法进行测试,实验结果表明该方法具有有效 性。 1手势区域切割及轮廓、凸包提取 手势识别的整体流程如图1所示。在进行手势 识别之前,必须先对手势区域进行有效分割,以确保 明显的手势特征能够被深度传感器采集捕捉,并且 不受身体其他部位干扰。另外,为实现本文提出的 率不错,但是其识别率受到光线强弱极大的影响; Frati提出了利用数据手套进行手势识别的方法 , 该方法尽管准确率能够得到保证,但是用户体验并 不是十分友好。近年来,由于硬件厂商在自然人机 交互设备开发上付出了努力,成功地开发出了一系 列深度图像传感器,如Microsoft的Kinect等。这使 得基于深度图像的手势识别成为了又一个研究热 点,如Zhou Ren提出的利用Kinec-t基于手指的 EMD的鲁棒性手势识别方法 J。基于Kinect深度 图像的方法相较于前述的数据手套以及基于RGB 手势识别方法,需要计算特征参数。这些参数需要 利用手势轮廓及凸包进行计算,故而需先行对采集 深度图像进行预处理。 图像有很大的改进,用户体验以及抗干扰性都有提 升。尽管如此,该领域研究还处于初级阶段,如李瑞 峰等 提出的手势识别方法无法很好地识别例如 握拳、五指并拢的手掌类没有单独手指显现特征的 常用手势,而Yan Wen 的方法则无法识别具体的 手势。由于受硬件性能以及手势的复杂程度等客观 收稿日期:2013—08—13 修回日期:2013—09—06 图1整体流程图 1.1手势区域分割 本文中所做实验采集数据由Kinect传感器采 集得到,其空间分辨率为320×240。数据采集过程 第2期 孟上等:一种基于深度图像的手势识别算法 25 圆相切手指数近似等于 +1。如图7所示,(4)所 示手势与(7)所示手势有效凸缺陷数相同,且特性 角都为钝角,CCR并无明显差别,但(7)手势与凸包 有效外接圆顶点数为2,所以凸包有效外接圆顶点 数能够有效区分图示2种手势。 2.2手势分类与决策 根据以上4种特性参数的连判,可分类识别9种 势不标准或因手势与传感器角度不同产生的误判, 当且仅当DCD=3,且其所有DCDA<90。时识别为 手势8,否则识别为手势9;当DCD=2时,若其所有 DCDA>90。则识别为手势6,仅有1个DCDA<90。时 识别为手势5,全部DCDA<90。时,识别为手势9;当 DCD=1时,若该DCDA为锐角,则识别为手势5(为 防止用户做手势3时大拇指并不拢,当CCR>0.45 时,判定为手势3,原因:手掌手势3投影面积大于 手势5投影面积,且此二组手势凸包外接圆面积近 常见手势。首先建立分类决策树,其识别流程如图8 所示。根据DCD参数对不同手势第一次加以区分; 对于DCD参数相同的手势再通过DCDA参数区分; 若依然无法区别则利用CCR参数区分;最后使用CD- 为参数加以区分。手势1能够通过DCD参数唯 一似。)若该DCDA为钝角,且CDVC=2,则识别为手 势7,否则识别为手势4;当DCD=0时,若CCR>0.55 则识别为手势2,若0.55>CCR>0.35则识别为手 势3,为了防止手势角度等误判,CCR<0.35时,识别 为手势4。至此,图7所示全部9种手势即可识别。 地识别且其DCD≥4;在理想条件下,手势9的 一 DCD=2,手势8的DCD=3,但为了识别因用户手 手势表观特征 IDCD=0 /lDCD=4 ——人、/!—一 CCR<O.55> \ 、否 否 手势1 l I是 广.—土_一 ≥ l1 < CD =2、、l是 l手势61 I l手势9 l手势2l 否 —— / l ll是 一———!一 手势7 l l手势4 l是 l手势3} l手势 5 l是 l 冈 2.3手势的旋转与缩放 体其他肤色区域所干扰,手势所在平面位置对测试 结果并无影响。 为了做到用户友好,手势识别应不受手势旋转 角度以及手势区域远近的影响。由于本算法使用 DCD、CCR参数为比值,这使得本文方法具有良好的 自适应性;DCDA与CDVC参数本身即具有缩放以 及旋转不变性,故而能够在手势旋转及缩放状况下 准确识别手势,不受影响。 为了验证本文所述方法之有效性,针对图7中 9种手势进行识别实验,由5人在不同光线以及不 同背景条件下对每种手势做20次,每人计180次,5 人共计900次。表1中第一列为输入采样手势类 型,对应第2列至第9列为系统识别的手势类型。 从表1中可以看出手势识别结果,手势5,9识别率 3实验及分析 由于本文所用方法采用红外深度数据,对光线 100%,手势8与1识别率为99%。手势2,3,4,6,7 不敏感,故而在不同光线背景下测试对结果无任何 影响。另一方面,基于RGB摄像头的手势识别容易 将手势区域与其他肤色区域产生混淆,而本文方法 采用深度图像进行识别,且前章提到手势区域与其 他身体区域处于不同深度级,因此手势并不会被身 识别率分别为96%,93%,96%,89%,92%,其中3, 6,7由于不同人对于该手势表达形式有较大差异, 故而识别率偏低。综上,从表1中得出对于图7的9 种常用手势的平均识别率为96%,相比空间分布特征 的手势识别算法(在普通光照条件下识别率为95.4%, 强光及弱光背景条件下测试效果为13.6%) ,本 文所提出的方法有较大优势。 26 数字通信 [2] 9 第41卷 FRATI V.PR I。I’ICHIZZO D.Using Kinect for hand 本文利用的设备为Kinect XBOX版本,通过 2。4 6 USB与电脑进行连接传输数据,采样图片分辨率为 320 x240像素,识别速度可达30帧/s,能够满足实 tracking and rendering in wearable haptics[C]//worId Haptics Confefence(WHC),201 1 IEEE.Istanbul: IEEE,2011:317—321. 时识别的要求。除此之外,由于本方法算法复杂度 6 [3] REN Zhou,YUAN Junsong,ZHANG Zhengyou.Robust hand gesture recognition based on finger—earth mover S 较低,可以利用多次连判的方法来进一步提高手势 4 4 识别准确性。 4% 表1 各个手势识别的识别手势结果以及综合识别正确率 l 5 3 distance with a commodity depth camera[C]//Proceed— ings of the 19th ACM international conference on Multi— media.New York:ACM,201 l:1093—1096. 手势编号 识别率 l 2 3 4 5 6 7 8 94 [4] 李瑞峰,曹雏清,王丽.基于深度图像和表观特征的 手势iY,JjIJ[J].华中科技大学学报:自然科学版,2011 (2):325—329. /% 6 [5] 1 1 WEN Yan,HU Chuanyan,YU Guanghui,et a1.A robust method of detecting hand gestures using depth sensors 『C]//Haptic Audio Visual Environments and Games (HAVE),2012 IEEE International Workshop on.Mu— % % nich:IEEE,2012:72—77. % S.Topological structural analysis of digitized bi— [6] SUZUKInary images by border following[J].Computer Vision, Graphics,and Image Processing,1985,30(1):32-46. [7] HOMMA K,TAKENAKA E.An image processing meth— od for feature extraction of space—occupying lesions[J]. Journal of Nuclear Medicine:Oficialf Publication,Society 4 结 论 本文提出了一种全新的手势识别方法。该方法 提取有关手掌表观的4个特性参数:DCD,DCDA, CCR,CDVC,利用此4种参数对手势进行连判,实验 结果证实了本方法的有效性。由于本文的方法复杂 of Nuclear Medicine,1985,26(12):1472. [8] ZHANG Zhengyou.Parameter estimation techniques:A tutorial with application to conic fitting[J].Image and Vision Computing,1997,15(1):59-76. [9] BRADSKI G,KAEHLER A.Learning OpenCV:Com— purer Vision with the OpenCV Library[M].[s.1.]:O Reilly Media,Incorporated,2008. 度低,所以可以用在展示厅以及多种需要自然人机 交互的场合,具有很好的应用前景。 参考文献: [1] 杨波,宋晓娜,冯志全,等.复杂背景下基于空间分布 作者简介: 孟上(1989--),男,山东青岛人,硕士研究生,主要研 究方向为图像处理、计算机视觉等,E—mail:mertonmrng@ gmail.con。 基金项目:国家自然科学基金(61102131);重庆市科委自然 科学基金计划资助项目(CSTC,2010BB2411);重庆市大学生 创新创业训练计划项目(20120617008) 特征的手势识别算法[J].计算机辅助设计与图形学 学报,2010,22(10):1841—1848. Method of gesture recognition based on depth image MENG Shang,GAO Chenqiang,YANG Luyu (Chongqing Key Laboratory of Signal and Information Processing,Chongqing University of Posts and Telecommunications,Chongqing 400065,P.R.China) Abstract:This paper focuses Oil detailed hand recognition using the depth image provided by Kinect sensor.The authors ifrst segment the hand gesture area and find the contour and convex hull of hand shape,and their enclosing circle;second, we calculate four feature parameters of detected contour and convex hull;finally,we use these parameters to build a deci— sion tree to realize the hand gesture recognition.This method,which can recognize 9 types of daily gestures,has been test— ed,and the accuracy of individual gesture type is from 89%to 100%while the combined accuracy of gesture recognition is 96%. Key words:gesture recognition,Kinect sensor,human computer interaction (责任编辑迟蕾)