研究生: 柯志函
Chih-han Ko
論文名稱: 無穿戴即時三維指向偵測暨指向手勢辨識系統設計與開發
Design and Development of Hand-free and 3-D Pointing Gesture Recognition System
指導教授: 李永輝
Yung-Hui Lee
口試委員: 王孔政
Kung-Jeng Wang
Wen-Dwo Yang
學位類別: 碩士
系所名稱: 管理學院 - 工業管理系
Department of Industrial Management
論文出版年: 2009
畢業學年度: 97
語文別: 中文
論文頁數: 98
中文關鍵詞: 無穿戴人機介面即時系統三維相機校正膚色模型物件追蹤軌跡辨識指向手勢辨識
外文關鍵詞: Bare hand HCI, real time system, 3-D camera calibration, skin color model, object tracking, trajectory recognition, pointing orientation, gesture recognition
為了驗證無穿戴指向手勢的優勢,本研究設計了一套指向手勢辨識邏輯,並利用Finite State Machine將手勢組合與音樂播放介面的功能(播放、暫停、音量控制、曲目更換)配對。驗證結果顯示,下達各手勢指令的時耗平均在4秒以內,正確率則在90%以上。

Pointing gesture is a very intuitive human communication. Basically, the pointing orientation has a fully spatial compatibility, and the meaning of gesture is in the pointing trajectory. The objective of this study is to design and development a "free-hand, 3 dimensional, real time, pointing gesture recognition system” using 2 cameras.
When pointing an object, the eye, the finger, and the object should be collinear. Base upon this principle, sub-system of 3-D camera calibration, hand/head area detection, and/head tracking were developed to continuously tracking the hand/head 3-D positions. The 3-D pointing positions were reconstructed in a large screen with a refresh speed of 20 Hz. It was then the velocity and the accelerations of the pointing trajectories were calculated.
To verify the advantage of the system, we built a remote controlled music player with free-hand comments of play, pause, volume control, move to a previous, and move to the next control. Experiment result showed that the average time-spending for gesture command is less than 4 seconds, and the recognition rate of all comments is more than 90%.

摘要 i 英文摘要 ii 誌謝 iii 目錄 iv 表目錄 vi 圖目錄 vii 第一章 緒論 1 1.1 研究背景 1 1.2 研究動機 4 1.3 研究目的 6 1.4 系統架構概述 7 1.5 研究限制 9 1.6 論文架構 10 第二章 參考文獻 11 2.1 遊戲控制器之發展 12 2.2 手勢辨識之研究 14 2.2.1 以膚色為線索的手形擷取 14 2.2.2 以手形輪廓資訊的手勢辨識 18 2.3 手座標軌跡追蹤與辨識之研究 22 2.4 指向偵測與辨識之研究 25 2.5 小結 28 第三章 系統設計與開發過程 29 3.1 研究採用的指向定義 29 3.2 系統模組運作流程 31 3.3 三維相機校正 33 3.3.1 DLT的各空間關係定義 34 3.3.2 DLT參數求解 39 3.3.3 DLT基礎定義向量重建 40 3.3.4 DLT座標重建 42 3.3.5 DLT實施順序 43 3.4 二維頭手區塊偵測 44 3.4.1 膚色模型設計 44 3.4.2 濾除小型雜訊-侵蝕演算法 52 3.4.3 頭手位置選擇-K-means分群演算法 53 3.5 二維頭手軌跡追蹤 54 3.5.1 以Histogram為基礎的物件模型設計 55 3.5.2 評估候選區與目標模型的相似度 56 3.5.3 利用梯度法修正候選點 57 3.5.4 Kernel Based Object Tracking演算法 59 3.6 三維指向重現 61 3.7 指向軌跡辨識 62 3.7.1 設定手勢需要對應的功能 64 3.7.2 由座標軌跡序列抽取特徵向量 65 3.7.3 手勢辨識邏輯建構 69 第四章 實驗結果與系統驗證 72 4.1 系統各階段產出實驗結果 73 4.1.1 三維相機校正結果 73 4.1.2 二維頭手區塊偵測結果 76 4.1.3 二維頭手追蹤-Kernel Based Object Tracking實作結果 77 4.1.4 三維指向重現實作結果 80 4.2 系統使用者介面呈現 82 4.3 系統特色探討 85 4.4 系統驗證實驗 86 4.5 實驗結果分析 88 4.5.1 即時三維指向偵測及軌跡重現能力分析 88 4.5.2 即時指向手勢辨識應用情境可用性分析 88 第五章 結論與建議 91 5.1系統建置成果 92 5.2 系統及應用介面可用性驗證 93 5.3 結論 93 5.4 建議 94 文獻 95 附件 98

