簡易檢索 / 詳目顯示

研究生: 葉志強
Yeh, Chih-Chiang
論文名稱: 音叉頻譜在母音辨識上之應用
指導教授: 沈士育
Shen, Shih-Yu
學位類別: 碩士
Master
系所名稱: 理學院 - 數學系應用數學碩博士班
Department of Mathematics
論文出版年: 2002
畢業學年度: 90
語文別: 中文
論文頁數: 46
中文關鍵詞: 母音辨識音叉頻譜
相關次數: 點閱:90下載:2
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 在語音訊號中,母音是最主要的部分,因此在國音的辨識上,首要的目標即是能成功的辨識母音。而本論文的主要概念是以一連串不同共振頻率的音叉來模仿人耳的聽覺系統。首先將音叉的運動方式轉為數學模型,再經由數值解求出特徵參數後,經過辨識流程的前置處理與策略的分類,最後達到母音的辨識。在本方法中,經由實驗測試簡單母音,不分男女音,辨識率約95%,而複合韻母則為89%,就一個新發展之方法而言,辨識率相當高,值得繼續發展。

    none

    第一章 緒論 1 1.1 簡介 1 1.2 聲音之介紹 3 1.3 國音學概念 5 1.4 章節概要 9 第二章 理論分析 10 2.1 人耳系統與音叉特性 10 2.2 數學模型的架構 15 2.3 微分方程式之數值解 20 第三章 訊號處理與辨識流程 24 3.1 錄音與語音訊號蒐集 24 3.2 辨識流程之前置處理 27 3.3 辨識流程之辨識策略 32 第四章 實驗結果 40 4.1 實驗環境 40 4.2 實驗設計 41 4.3 實驗結果 42 第五章 總結 44 5.1 討論 44 5.2 建議 46 參考文獻 i 表 目 錄 編號 頁數 表1.1:聲音的分貝相關表...................................4 表1.2:國音聲母表.........................................6 表3.1:WAV檔案格式表.....................................25 表3.2:韻母可能的組合....................................37 表4.1:實驗一(單韻母)之結果..............................42 表4.2:實驗二(複合韻母)之結果............................42 表4.3:單韻母與複合韻母之總辨識率........................42 圖 目 錄 編號 頁數 圖2.1:人耳的周邊聽覺系統................................10 圖2.2:中耳、包括耳膜及三個小骨..........................11 圖2.3:中耳擴音作用原理一................................11 圖2.4:中耳擴音作用原理二. ..............................11 圖2.5:科蒂氏器..........................................12 圖2.6:音叉的構造........................................13 圖2.7:音叉振動與空氣分子間之關係........................13 圖2.8:頻率與音叉關係圖..................................14 圖2.9:微分方程式(Ⅰ)之圖解..............................16 圖2.10:微分方程式(Ⅲ)之圖解..............................17 圖3.1:Cooledit 2000錄音介面程式圖......................26 圖3.2:音叉的設定........................................28 圖3.3:語音之能量圖與起始點和結束點......................29 圖3.4:高斯分佈加權及平滑化之曲線圖......................30 圖3.5:母音ㄚ之統計圖....................................31 圖3.6:母音ㄩ之統計圖....................................31 圖3.7:初步分群圖........................................32 圖3.8:G1細分流程圖......................................33 圖3.9:G2細分流程圖......................................34 圖3.10:G3細分流程圖.....................................35

    [1] E.Oran Brigham,“The Fast Fourier Transform and its Application”,Prentic-Hall International Editions,1988.
    [2] Gordon E. Pelton,“Voice Processing”, McGraw-Hill Serier on Computer Communcations,1992.
    [3] Lawrwnce Rabiner and Biing-Hwang Juang,“Fundamentals of Speech Recognition”,Prentice-Hall Inc.,New Jersey,1993.
    [4] L.R Rabiner,“A tutorial on hidden Markov models and selseted application in speech recognition”, Proc. IEEE, vol. 77, pp.257-286, Feb. 1989.
    [5] O'Shaughnessy and Douglas,“Speech communication : human and machine”, Addison-Wesley Pub. Co., 1987
    [6] Sadaoki Furui,“Digital Speech Precessing,Synthesis, and Recognition”,Basel,Marcel Dekker Inc,New York,1989.
    [7] 馬大猷/楊訓仁,“聲學漫談”, 牛頓,台北, 1996.
    [8] 國立台灣師範大學國音教材編輯委員會編撰,“國音學”,正中書局, 台北, 1992.
    [9] 張斌,“耳鼻喉科學”,臺初版, 正中書局, 台北, 1996.
    [10] 陳明瑩,“PC 電腦餘音辨識實作”,初版,旗標出版社,台北, 1994.
    [11] 黃介一,“時間域上中文語音辨識研究”, 國立成功大學應用數學研究所碩士論文, 1997.
    [12] 楊永裕,“與說話者不關的母音辨識”, 國立成功大學應用數學研究所碩士論文, 1995.
    [13] 劉康寰,“聲波與耳”,譯自:“Waves and the ear”,台灣商務,台北,1960.
    [14] 薛正本,“樂器演奏中音符與節奏的辨識”, 國立成功大學應用數學研究所碩士論文, 2000.
    [15] 羅志帆,“與說話者不關的中文韻母辨識”,國立成功大學應用數學研究所碩士論文, 1996.

    下載圖示 校內:立即公開
    校外:2002-07-09公開
    QR CODE