簡易檢索 / 詳目顯示

研究生: 陳建明
Chen, Jian-Ming
論文名稱: 植基於本體論之中文文件摘要系統
An Ontology-based Chinese Document Summarization System
指導教授: 李昇暾
Li, Sheng-Tun
學位類別: 碩士
Master
系所名稱: 管理學院 - 資訊管理研究所
Institute of Information Management
論文出版年: 2005
畢業學年度: 93
語文別: 中文
論文頁數: 71
中文關鍵詞: 知網知識管理系統本體論自動摘要產生系統案例式推理
相關次數: 點閱:55下載:1
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  •   網路普及化時代的來臨,使得資訊的取得不再是件困難的事,相對地也衍生出資訊過載的困擾,使用者在面對如此龐雜的大型資料來源時,往往難以有效且快速地找到符合需求的資訊。因此,近年來許多學者投入資訊擷取相關領域的研究,致力於發展出更快更有效的資訊取方法;文件摘要技術在這個領域扮演了相當重要的角色。摘要的意義在於以簡潔的文句來表達整篇文章所包含的資訊,幫助使用者快速地瀏覽文章。因此,欲從一篇文章產生摘要必須對文章的內容有相當程度的分析與了解才能作到。目前一般的文件自動摘要技術,多半以摘錄文章的某一段落或使用統計分析,計算句子的權重分數,位置等因素,以擷取具代表性的句子組成摘要,其摘要內容的正確性,整體連貫性皆有改善空間。而以中文為應用的摘要系統由於中文語言的複雜性更具挑戰。本研究建構一以本體論(ontology)為基礎的中文文件摘要產生系統,系統以本體論表達欲取出的摘要知識結構,並透過一層直譯層處理本體論與文章內容之間的對映。在直譯層中,我們利用案例式推理(CBR)的方式解析自然語言文句,將文句中相關於本體論的概念實例擷取出來,透過本體論的推論,轉換成以事件本體論(event ontology)為中介描述的結構化資訊。此結構化的資訊將能夠利用預先建置的文句樣板將之轉換成使用者所需要的摘要。本研究實驗的對象為NBA球賽相關報導,實驗的結果顯示本研究所提出的系統在摘要句擷取與本體論概念的辨識上能達到82%與80%的準確率。

    none

    第一章 緒論 1 第一節 研究背景 1 第二節 研究動機 2 第三節 研究目的 3 第四節 研究流程 3 第五節 論文章節架構 4 第二章 文獻探討 5 第一節 本體論 5 1. 何謂本體論 5 2. 本體論與知識管理 6 3. 本體論學習 7 第二節 文件摘要技術 9 1. 文件摘要的角色 9 2. 文件摘要的定義 9 3. 文件摘要的種類 10 4. 文件摘要技術的現況 11 第三節 字詞處理技術 14 1. 中文斷詞處理 14 2. 中文字詞語義相似度 15 第四節 案例式推理技術 18 1. 案例式推理簡介 18 2. 案例擷取演算法 19 3. 案例式推理與自然語言解析 20 第五節 小結 23 第三章 研究方法 24 第一節 文件前處理 26 第二節 概念擷取 28 1. 自然語言案例表達方式 28 2. 字詞語義相似度的計算 30 3. 案例擷取(Case Retrieval) 31 4. 案例比對(Case Match) 33 第三節 摘要產生(Summary Generation) 37 1. 事件本體論的建立(Event Ontology Population) 37 2. 摘要的產生 39 第四節 小結 39 第四章 系統架構與實驗結果 40 第一節 系統架構 40 1. 系統元件概觀 40 2. 軟體設計模式的應用 41 3. CKIP AutoTag 43 4. Selection Engine 44 第二節 實驗評估與分析 45 1. 評估方法 45 2. 實驗文集 46 3. 系統調校 48 4. 實驗結果 54 第三節 小結 66 第五章 結論與未來研究方向 67 第一節 研究貢獻 67 第二節 未來研究方向 68

    顏國偉、黃炳蔚 (2000)。基於知網的中文信息結構標注手冊。香港法住文化書院,未出版。

    董振東、董強:知網。(http://www.keenage.com)。

    Aamodt,A., Plaza,E.,(1994). Case-based reasoning: foundational issues, methodological variations, and system approaches. AI Communications, 7(1), 39-52.

    Alani, H., Kim, S., Millard, D. E., Weal, M. J., Hall, W., Lewis, P. H., & Shadbolt, N. R. (2003). Automatic Ontology-Based Knowledge Extraction from Web Documents. IEEE Intelligent Systems, 18(1), 14-21.

    Baeza-Yates, R., & Ribeiro-Neto, B. (1999) Modern Information Retrieval. New York: The ACM Press.

    CKIP AutoTag, available at http://gode1.iis.sinica.edu.tw/CKIP/

    Davies J., Fensel, & D., Harmelen, F. V., (2003), Towards the Semantic Web: Ontology-driven Knowledge Management. New York: Wiley.

    Dieng, R., Corby, O., Giboin, A., & Ribière, M. (1999). Methods and Tools for Corporate Knowledge Management. International Journal of Human-Computer Studies, 51, 567–598.

    Erich ,G., Richard, H., Ralph J., & John V., (1995) Design Patterns. Boston: Addison-Wesley Professional.

    Fensel, D. (2000). Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce. German : Springer.
    Foo, S. & Li, H. (2004). Chinese word segmentation and its effect on information retrieval, Information Processing and Management, 40, 161–190.

    Gruber, T. R. (1995). Towards principles for the design of ontologies used for knowledge sharing. International Journal of Human-Computer Studies, 43, 907-928.

    Guarino, N. (1997). Understanding, Building and Using Ontologies: A Commentary to Using Explicit Ontologies in KBS Development. International Journal of Human and Computer Studies, 46, 293-310.

    Heylighen, F., (1995), Ontology introduction. Retrieved December 20, 2004, from the World Wide Web: http://pespmc1.vub.ac.be/ONTOLI.html

    Maedche, A., & Staab, S., (2001). Ontology Learning for the Semantic Web. IEEE Intelligent Systems, 16(2), 72–79.

    Maedche, A., Motik, B., Stojanovic, L.,Studer, R., & Volz, R., (2003). Ontologies for Enterprise Knowledge Management. IEEE Intelligent Systems. 18(2). 26-33.

    Mani, I. (2000). The Challenges of Automatic Summarization. IEEE Computer Society Press, Los Alamitos, CA, USA . Volume 33 , Issue 11 Pages: 29 - 36

    Mani, I. (2001). Recent Developments in Text Summarization. Proceedings of the 10th international conference on Information and knowledge management, Atlanta, Georgia, USA.

    Minghong, L., Andreas, A., Ansger, B., Knut, H., & Michael, S. (1999, June). Ontologies for Knowledge Retrieval in Organizational Memories. International Workshop on Learning Software Organizations (LSO) at SEKE'99, Kaiserslautern, Germany.

    Noy, N. F., & McGuinness, D. L. (2001). Ontology Development 101: A Guide to Creating Your First Ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880.

    Rush, J.E., Salvador, R. & Zamora, A. (1971), Automatic abstracting and indexing. II. Production of indicative abstracts by application of contextual inference and syntactic coherence criteria. Journal of the American Society for Information Science, 22(3), 260-274.

    Selection Engine, available at http://selectionengine.sourceforge.net/

    Silva, F., Vasconcelos, V., & Robertson, D. (2002). On the Insufficiency of Ontologies: Problems in Knowledge Sharing and Alternative Solutions. Knowledge-Based Systems, 15, 147-167.

    Soo, V. W. , Lee, C. Y., Li, C. C., Chen, S. L., Chen, C. C. (2003). Automated semantic annotation and retrieval based on sharable ontology and case-based learning techniques. Proceedings of the third ACM/IEEE-CS joint conference on Digital libraries, Houston, Texas

    Soo, V. W., Lee, C. Y., Yeh, C. C., & Chen, C. C. (2002). Using Sharable Ontology to Retrieve Historical Images. Proceedings of ACM/IEEE International Joint Conference on Digital Library, Portland, Oregon, USA.

    Tiwana, A. & Ramesh, B. (2001). Integrating Knowledge on the Web. IEEE Internet Computing, 5(3), 32-39

    Uschold, M., Gruninger, M. (1996). Ontologies: Principles, Methods and Applications, The Knowledge Engineering Review, 11, 93-136.

    Waterson, A. & Preece, A. (1999). Verifying Ontological Commitment in Knowledge-based Systems. Knowledge-Based System, 12, 45-54.

    下載圖示 校內:2007-06-23公開
    校外:2007-06-23公開
    QR CODE