| 研究生: |
蘇育民 Su, Yu-Min |
|---|---|
| 論文名稱: |
具音源方向與臉部辨識之主動式追蹤系統 Active Tracking System by Sound Direction and Face Recognition |
| 指導教授: |
王宗一
Wang, Tzone-I |
| 學位類別: |
碩士 Master |
| 系所名稱: |
工學院 - 工程科學系 Department of Engineering Science |
| 論文出版年: | 2010 |
| 畢業學年度: | 98 |
| 語文別: | 中文 |
| 論文頁數: | 130 |
| 中文關鍵詞: | 嵌入式 、音源辨識 、主動式 、影像監控 、服務型機器人 |
| 外文關鍵詞: | Embedded, Sound direction recognition, Active, Visual surveillance, Service robot |
| 相關次數: | 點閱:132 下載:6 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
目前正處於科技蓬勃發展的時代,應用於公共場合、公司機關或展覽會場的服務型機器人提供了人機互動、娛樂、導引、展示以及安全監控的功能,本論文針對服務型機器人安全監控與人機互動的區塊提出一整合音源方向與臉部辨識之主動式追蹤系統,系統實現整合了嵌入式音源辨識與主動式影像監控兩個子系統。嵌入式音源辨識系統主要負責進行麥克風陣列訊號擷取與音源訊號處理,並實現完成一個使用單處理器即可獨立運作之音源辨識系統。而主動式影像監控系統主要透過可遠端控制之主動式監控攝影機,來擷取影像訊號,經及時處理後來進行場景監控、人臉偵測、人臉追蹤以及人臉辨識等。本研究亦針對服務型機器人的應用,整合了此一音源方向與臉部辨識之主動式追蹤系統,以實現了一個具聽覺與視覺之服務型機器人的應用方案。
Nowadays, service robots roaming in public areas, institute or company buildings, and exhibition courts can provide a variety of functions like human machine interactions, guiding, entertainments, exhibitions and security surveillances. This paper proposes for service robots an active tracking system integrated with sound direction and face recognition, which is realized with two integrated sub-systems, an embedded sound direction recognition sub-system and an active visual surveillance sub-system, respectively for human interaction and security surveillance purpose. The operation of the embedded sound direction recognition sub-system is majorly for acquiring and processing audio signal from a microphone array. It has been realized as a complete sound source recognition system with one single processor. While the major operation of the active visual surveillance sub-system is, via a remote controlled active camera, to acquire video images and, after real time processing, to perform scene monitoring, face detection, face tracking and face recognition. To evaluate its feasibility, in the study this sound direction and face recognition based active tracking system is integrated into a service robot for realizing its hearing and visual ability capable for a variety of applications.
[1] K. Sakai, et al., “Developing a service robot”, in Proceedings of the IEEE International Conference on Mechatronics & Automation, CANADA, pp. 91-96. , July 2005.
[2] K. Sakai, et al., “Developing a service robot with communication abilities”, in Proceedings of the IEEE Int’l Workshop on Robot and Human Interactive Communication, ROMAN, pp. 91-96. , 2005 .
[3] NTU-1 智慧型校園導覽互動機器人, http://www.robotworld.org.tw/index.htm?pid=12&News_ID=635, last accessed June 2009.
[4] 張書龍,具辭書式情境感知之語音導引機器人,成功大學工程科學所碩士論文,民國98年。
[5] 曾宣僑,具人機互動能力之服務型機器人,成功大學工程科學所碩士論文,民國98年。
[6] 莊鎮陽, 智慧型接待服務機器人互動功能之研製, 南台科技大學電機所碩士論文,民國96年。
[7] 蔡仲齡,含語者驗證之小型場所人臉辨識門禁系統的研發,成功大學工程科學所碩士論文,民國97年。
[8] 黃泰祥,具備人臉追蹤與辨識功能的一個智慧型數位監視系統,中原大學電子工程研究所碩士論文,民國93年。
[9] 蔡博智,影像追蹤方法應用在監視系統之研究,中原大學機械工程學系碩士論文,民國91年。
[10] 黃明燈,監控系統之研究,交通大學資訊科學系碩士論文,民國91年。
[11] 黃敏峰,人臉追蹤法應用於監控系統之研究,成功大學電機工程研究所碩士論文,民國92年。
[12] 陳廣平,在監控環境架構中之人臉影像偵測系統設計,逢甲大學電機工程研究所碩士論文,民國96年。
[13] V. Kettnaker and R. Zabih “Bayesian Multi-camera Surveillance,” Proc.of IEEE Computer Society Conf. on Computer Vision and PatternRecognition, vol. 2, pp. 23-25, June 1999.
[14] 謝明逢,利用雙攝影機取像模組建構一大型環境監控系統,中央大學資訊工程研究所碩士論文,民國94年。
[15] 馬翔毅,使用動態背景補償以偵測與追蹤移動監控畫面之前景物,中央大學資訊工程所碩士論文,民國96年。
[16] 高佳成,基於PHBDR之遠程操作系統預測顯示方法,台灣科技大學資訊工程所碩士論文,民國94年。
[17] 黃啟揚,以雙核心平台實現即時影音追蹤與語音純化系統,交通大學電機與控制工程研究所碩士論文,民國97年。
[18] 張永鵬,影像追蹤方法應用在監控系統之研究,中原大學機械工程研究所碩士論文,民國91年。
[19] A.Mian, “Realtime Face Detection and Tracking Using a Single Pan, tilt Zoom camera”, 23rd International Conference Image and Vision Computing New Zealand, 2008.
[20] 賴建瑞,麥克風陣列語音辨識之研究,成功大學資訊工程學系碩士論文,民國89年。
[21] 吳志祥,應用全方位移動機器人搜尋音源方位,成功大學工程科學所碩士論文,民國96年。
[22] Kai-Tai Song* and Jian-Liang Chen, “Sound Direction Recognition Using a Condenser Microphone Array”,lEEE International Symposium on Computational Intelligence in Roboties and Automation, Taiwan R.O.C., pp.1445-1450, 2003.
[23] 陳建良,聲源方向辨識系統研製,交通大學電機與控制工程學系碩士論文,民國91年。
[24] 曾政傑,基於多重訊號分類之聲源方位偵測,台灣科技大學資訊工程系碩士學位論文,民國97年。
[25] 陳鈺淳,飛機駕駛艙之音源定位分析研究成功大學航空太空工程研究所碩士論文,民國93年。
[26] 涂莎莉,二維空間的音源定位:時域方法的實作與探討,清華大學資訊工程系碩士論文,民國94年。
[27] Brandstein, M. S., Adcock J. E., and Silverman H. F., “A closed-form locationestimator for use with room environment microphone arrays,” IEEE Transactions onSpeech and Audio Processing, pp. 45-50, Jan. 1997.
[28] 曾國坤著,ARM9 S3C2440與嵌入式Linux2.6.24設計實務,長高科技圖書,民國97年10月。
[29] 黃柏壽,USB高速影音資料傳輸介面設計與實現,南台科技大學電機所碩士論文,民國96年。
[30] R. C. Gonzalez, R. E. Woods “Digital Image Processing 2nd ed.” by Prientice-Hall,Inc 2002.
[31] Intel,“Open computer vision library,”www.intel.com/technology/com- puting/opencv/,2008.
[32] G. R. Bradski, “Computer Video Face Tracking for use in a Perceptual User Interface”, IntelR Technology Journal, 1998.
[33] 王科翔,多重人臉偵測與識別系統,成功大學工程科學所碩士論文,民國94年。
[34] Paul Viola, Michael Jones, "Rapid object detection using a boosted cascade of simple features", Proc. IEEE Conf. Computer Vision and Pattern Recognition, vol.1, pp. 511-518, 2001.
[35] Rainer Lienhart, Jochen Maydt, "An Extended Set of Haar-like Features for Rapid Object Detection", Proc. IEEE Int'l Conf. Image Processing, vol.1, pp. 900-903, 2002.
[36] Rainer Lienhart, Alexander Kuranov, Vadim Pisarevsky, "Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection", MRL Technical Report, 2002.
[37] 陳鴈書,ARM-based數位廣播隨選服務系統,南台科技大學電機所碩士論文,民國95年。