簡易檢索 / 詳目顯示

研究生: 顏睿群
Jui-Chun Yen
論文名稱: 結合RFID與隱藏式馬可夫模型之即時辨識點名系統
Base on RFID and HMM Real Time Recognition Roll-Call System
指導教授: 邱炳樟
Bin-Chang Chieu
口試委員: 徐敬文
Ching-Wen Hsue
方文賢
Wen-Hsien Fang
學位類別: 碩士
Master
系所名稱: 電資學院 - 電子工程系
Department of Electronic and Computer Engineering
論文出版年: 2008
畢業學年度: 96
語文別: 中文
論文頁數: 89
中文關鍵詞: 隱藏式馬可夫模型語者辨識RFID
外文關鍵詞: Hidden Markov Model, speaker recognition, RFID
相關次數: 點閱:165下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本論文提出二種方式完成課程點名系統。第一種是以隱藏式馬可夫模型為基礎之語者辨識系統,點名系統透過語者辨識,辨識出使用者後,該使用者再輸入密碼完成點名。第二種是再增加RFID 機制之語者驗證系統,此點名系統是使用者先透過個人的RFID卡宣告身分,系統再透過語者驗證增加典型系統的強健性,藉此完成點名。

    目前資料庫共有50人參與錄音,以每人使用30句做訓練語者模型為辨識基礎之下,語者辨識率可到達93%


    This thesis purposes two solutions to finish roll-call system.The first one is "HMM(Hidden Markov Model) based speaker recognition system",which implements the roll calling procedure by speaker recognition mechanism.The second one is “RFID plus speaker verification ”,under it’s designed operation,the roll calling is first RFID user identified followed by voice verification with much robust procedure.

    The speaker recognition rate will achieve up to 93% based on the speaker model of total 50 people, using 30 sentences by each person.

    第一章緒論 1.1前言與研究動機 1.2語者辨識簡介 1.3語者驗證簡介 1.4點名系統簡介 1.5辨識技術發展 1.5.1長時間平均的特性 1.5.2動態時間校準(Dynamic Time Warping) 1.5.3類神經網路(Artificial Neural Network) 1.5.4隱藏式馬可夫模型 1.5.5利用韻律訊息之強健性 第二章語者辨識系統 2.1語者辨識與語者驗證簡介 2.2系統架構 2.2.1硬體設備 2.2.2錄音流程 2.3語音前置處理 2.3.1預強化(pre-emphasis) 2.3.2音框處理(FrameBlocking) 2.3.3取漢明窗(HammingWindow) 2.4特徵擷取流程 2.4.1快速傅立葉轉換(FastFourierTransform) 2.4.2計算梅爾通道能量與梅爾三角帶通濾波器(Triangular Bandpass Filters) 2.4.3離散餘弦轉換(Discrete Cosine Transform) 2.5語者辨識 2.5.1語者辨識概念 2.6One Stage DP Algorithm演算法剖析 2.6.1MarkovModel 2.6.2One Stage Dynamic Programming Algorithm(一階動態程式演算法) 2.6.3觀測機率 2.7語者辨識流程 2.8語者辨識結果 2.8.1實驗假設 2.8.1.1辨識參數1 2.8.1.2辨識參數2 2.8.2人數增加與state關係 2.8.2.1辨識參數3 2.8.2.2辨識參數2-4 2.8.2.3辨識參數5 2.9章節結論 第三章語者辨識之效能評估與改進 3.1評估改進簡述 3.2單純語者辨識效能改進 3.2.1端點偵測 3.2.1.1R-S端點偵測(Rabiner&Samburmethod) 3.2.1.2能量端點偵測 3.2.1.3靜音切割後的辨識結果 3.2.2語音正規化 3.2.3去除直流偏壓DCZMEANSOURCE 3.2.4頻譜語料重疊處理 3.2.5不同參數與階數對於系統的影響 3.3高斯混合模型(Gaussian MixtureModel,GMM) 3.3.1高斯混和模型簡介 3.3.2高斯混和結果分析 3.3.3 modeltraining所選語料對辨識率的影響 3.3.4人數增加的影響 3.3.4.1Part2training之17人辨識 3.3.4.2Part1+Part2training之17人辨識 3.3.4.325人辨識 3.3.4.4final50人辨識 3.4多重效能改善 3.4.1語音長度正規化 3.4.2mfcc特徵參數處理 3.4.2.1mfcc參數正規化 3.4.2.2MVN正規化 3.4.3高斯混和數與語料數雙重混和比較 第四章資料庫 4.1資料庫簡介 4.1.1資料庫(Database)定義 4.1.2資料庫管理系統 4.1.3資料庫的資料模式 4.1.3.1階層式資料庫(HierarchicalDatabase) 4.1.3.2網狀式(Network)資料庫 4.1.3.3關聯式(Relational)資料庫 4.2個人的資料庫 4.2.1十一大資料表 4.2.1.1出缺席記錄表(absence) 4.2.1.2教室表(class) 4.2.1.3課程表(course) 4.2.1.4課程資訊(course_info) 4.2.1.5課程時間表(coursetime) 4.2.1.6部門表(Department) 4.2.1.7enrollment(修課登記) 4.2.1.8student(學生資料表) 4.2.1.9teacher(老師資料表) 4.2.1.10userlevelpermissions(使用者權限層級) 4.2.1.11userlevels(使用者層級) 4.3資料庫系統連結 4.4資料庫系統功能表 4.4.1以學生為例 4.4.1.1個人資料表 4.4.1.2查詢課程表 4.4.1.3我的課程表 4.4.1.4缺曠課查詢 4.4.1.5加退選課程 4.5點名系統簡介 4.6資料庫結論 第五章結論與展望 附錄 附錄一參與錄音名單 附錄二語料庫錄音內容 附錄二語音錄音程式 參考文獻

    【1】C. C. T. Chen, C. T. Chen, and P. W. Cheng,"Hybrid KLT/GMM Approach for Robust Speaker Identification,Electronics Letters, 16th, October 2003, Vol. 39, No.21.
    【2】C. C. T. Chen, C. T. Chen, and C. M. Tsai,"Hard-limited Karhunen-Loeve Transform for Text Independent Speaker Recognition," Electronics Letters, 20th, November 1997, Vol. 33, No. 24.
    【3】F. Pla and A. Molina. "Part-of-Speech Tagging with Lexicalized HMM," In proceedings of International Conference on Recent Advances in Natural Language Processing(RANLP2001), 2001
    【4】 Gish,H.; Schmidt, M. "Text-independent speaker identification",Signal Processing Magazine, IEEE, Volume: 11 Issue: 4 , Oct. 1994
    【5】 HTK BOOK(for HTK Version 3.4)
    【6】 H. P. Zhang, Q. Liu, H. Zhang and X. Q. Cheng. "Automatic Recognition of Chinese Unknown Words Based on Roles Tagging," In Proceedings of First SIGHAN Workshop on Chinese Language Processing, pp. 71-77, 2002
    【7】Israel Koren, Computer arithmetic algorithms, Prentice-Hall, Inc, 1993.
    【8】John R. Deller, John G. Proaskis, and John H. L. Hansen, "Discrete-Time Processing of Speech Sign
    【9】Jialong Ho, Li Liu, and Gunther Palm, "A Discriminative Training Algorithm for VQ-Based Speaker Ide Trans. on Speech and Audio Processing, Vol.7, No.3, May 1999, pp353-356
    【10】 K.C. Chang, Digital Systems Design with VHDL and Synthesis: An Integrated Approach, Wiley-IEEE Computer Society Press, April 1999.
    【11】 L. Rudasi and S. A. Zahorian,"Text-independent talker identification with neural networks," in Proc. IEEE ICASSP, May 1991, pp.389-392.
    【12】 Laszlo Rudasi and Stephen A. Zahorizn,"Text-Independent Talker Identification With Neural Networks" in Proc. IEEE
    【13】 L. R. Rabiner. "A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition," Proceedings of the IEEE, Vol.77, No.22, pp. 257-286, 1989
    【14】Martin T. Hagan, Howard B. Demuth, and Mark Beale, "Neural Network Design", PWS Publishing Co
    【15】N.R. French and J.C. Steinberg, "Factors governing the intelligibility of speech sounds", J. Acoust. So 1947
    【16】N. Xue and L. Shen. "Chinese Word Segmentation as LMR Tagging," In Proceedings of Second SIGHAN Workshop on Chinese Language Processing, pp.176-179, 2003
    【17】Pierre Castellano, "A Study of LVQ Learning Schedules for ANN Speaker Identification", IEEE Region international Conference, Theme: Frontiers of Computer Technology, Proceedings of 1994, pp902-905
    【18】Teuvo Kohonen, "The Self-Organizing Map", Proceedings of the IEEE, Vol.78, No.9, September 1990
    【19】Sarel van Vuuren and H. Hermansky,"Data-Driven Design of RASTA-LikeFilters", ICSLP 1996.
    【20】陳松琳,"以類神經網路為架構之語音辨識系統",國立中山大學電機工程學系碩士論文,2001
    【21】謝芳易,"結合隱藏式馬可夫模型一階動態規劃演算法之連續語音辨識系統",國立中山大學電機工程學系碩士論文,2003
    【22】鍾偉仁,"語者辨認與驗證初步之研究",國立台灣大學,2000
    【23】陳高斌,"應用SOM-PNN混合神經網路在語者識別",義守大學,2001
    【24】古詩峰,"基於小波轉換特徵參數以及使用麥克風和電話語料之大量語者識別系統",長庚大學,2002
    【25】鄭順德,"不特定語句中量語者辨識系統之設計研究",國立中山大學,2002
    【26】黃俊豪,"大量語者不特定語句環境下語者辨識系統之特徵設計",國立中山大學,2000
    【27】周家得,"以支向機為基礎並結合特徵擷取之語者辨識系統",國立台灣科技大學,2006
    【28】顏銘祥,"以DSP為架構的不特定語句即時語者辨識系統",國立中山大學,2004
    【29】林青慧,"強韌式語者辨識系統:從麥克風、市話到手機",國立清華大學,2003
    【30】林千翔,"基於特製隱藏式馬可夫模型之中文斷詞研究",國立中央大學,2006
    【31】楊鎮光,"VisualBasic與語音辨識",松崗,2002
    【32】王理嘉,"語音學教程",五南圖書出版公司,2008
    【33】謝秀琴,"數位語音訊號基本原理",1996
    【34】楊鎮光,"VisualBasic與語音辨識-讓電腦聽話",2002
    【35】王小川,"語音訊號處理",2004
    【36】吳佳諺,"MySQL資料庫教學",2005
    【37】梁仁楷,"MySQL5資料庫實務",網奕資訊科技,2006
    【38】中華民國電腦技能基金會,"MySQL5實力養成暨評量",碁峰資訊,2007
    【39】CodeMaker工作室,"MySQL函式庫查詢字典",碁峰資訊,2002
    【40】張智星,"音訊處理與辨?-3.1端點偵測",國?清華大學多媒體資訊檢?實驗室.
    【41】孫惠民,"MySQL5 ForWindows視覺化資料庫管理及開發經典",文魁資訊,2005

    無法下載圖示 全文公開日期 2013/07/29 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)
    全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
    QR CODE