簡易檢索 / 詳目顯示

研究生: 陳炳仁
Bing-Ren Chen
論文名稱: 等比例時間校正國語數字語音辨認技術之研究
A study on the proportional time warping for spoken Chinese digit recognition
指導教授: 邱榮輝
Jung-Hui Chiu
口試委員: none
學位類別: 碩士
Master
系所名稱: 電資學院 - 電子工程系
Department of Electronic and Computer Engineering
論文出版年: 2021
畢業學年度: 80
語文別: 中文
論文頁數: 82
中文關鍵詞: 等比例時間國語數字語音辨認技術線性時間動態時間校正時間校正法工程科技結構學
相關次數: 點閱:239下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報

在語音辨認系統中, 比對樣本時如使用時間校正方式, 一般是使用線性時間( 簡稱L.

T.W.) 校正或動態時間校正( 簡稱D.T.W.)。 線性時間校正有較快的比對速度, 但辨

認率較差; 而動態時間校正雖有較高的辨認率, 但比對速度很慢。本文則探討一種新

的時間校正法, 稱之為等比例時間校正法( 簡稱P.T.W.)。 此方式經以國語數字語音

測試, 顯示其辨認率不比動態時間校正差, 而比對速度則近似於線性時間校正。

等比例時間校正法, 是安排測試語音與參考樣本做等比例分割比對; 換言之, 等比例

時間校正法, 是將測試語音等分成和參考樣本樣的音框數目, 所以等比時間校正法的

音框長度隨測試語音者長成比例變化。

本文於等比例時間校正比對方式上, 使用三種不同比對方法, 分別為以字為單位等比

例時間校正比對( 簡稱P.T.W/W), 無聲與有聲語音分開比對方式一( 簡稱P.T.W./V1)

及無聲與有聲語音分開比對方式二( 簡稱P.T.W./V2)。經以國語連續語音實驗結果以

P.T.W./V2 辨認率95.4% 最高、P.T.W./V1 辨認率92.6% 次之、P.T.W./W辨認率92%

最低。

本文另探討P.T.W.參考樣本建立方式, 經實驗結果發現, 參考樣本建立以全部訓練語

音加以平均而得者有最佳的辨認率。


none

none

無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
全文公開日期 本全文未授權公開 (校外網路)
全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
QR CODE