簡易檢索 / 詳目顯示

研究生: 翁林澤
Weng, Lin-Tse
論文名稱: 應用分類器技術擷取並整合生物資訊來源之基因資訊系統
Gene Information System Using Classifier Technique for Text Retrieval with Biomedical Resources Integration
指導教授: 蔣榮先
Chiang, Jung-Hsien
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2003
畢業學年度: 91
語文別: 中文
論文頁數: 47
中文關鍵詞: 分類器基因資訊系統
外文關鍵詞: gene information system, classifier
相關次數: 點閱:60下載:3
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 隨著大量生物方面相關資訊被大量發表,如何能自大量的資料中找出有用的資訊便成為當今生物資訊領域中一個重要的課題。因此本論文主要在提出一個基因資訊探索的資訊系統,以提供研究人員研究上的幫助。
      本系統共計有三個核心模組,第一提供基因相關資訊的查詢,其中包含了基因資訊摘要,基因位置,及用GeneOntology註解之分子功能,生物程序,及細胞組成等資訊。第二則可查詢資料庫內的基因功能資訊,並可經由文件看到該功能是如何被描述到的。第三個部分則是直接針對文件做基因功能的擷取,而此擷取出來的結果有可能是在資料庫中已有註解過的,也有可能是未被註解過的。
      我們實際將此理論架構加以實做,並和GeneCards系統加以比較,相信本系統是有其意義的。最後,希望本系統能實際對生物相關研究人員有所助益。

    第一章 導論…………………………………………………………………………1 1.1 研究動機…………………………………………………………………...1 1.2 系統概述與架構…………………………………………………………...2 1.3 資料處理策略……………………………………………………………...3 1.4 論文架構…………………………………………………………………...5 第二章 文獻回顧……………………………………………………………………6   2.1 資訊分類的方法………..………………………………………………….6 2.2  生物相關資訊來源………………………………………………………...8 2.3 論文相關系統…………………………………………………………….13第三章 基因相關資訊查詢與功能找出…………………………………………..17 3.1 系統完整架構…………………………………………………………….18 3.2 系統功能………………………………………………………………….19 第四章 基因相關資訊查詢………………………………………………………..23 4.1 基因資料庫介紹…………………………………………………………..23 4.2 基因相關資訊查詢………………………………………………………..24 第五章  基因功能之查詢與擷取…………………………………………………..28 5.1 查詢資料庫已有註解之功能……………………………………………..29 5.2 擷取文件中描述到的功能………………………………………………..30 5.2.1 特定語彙典之用途………………………………………………….30 5.2.2 文件分類器之架構與運作……….….….………………………….32 5.2.3 訓練樣本之收集..….…..….….…………………………………….35 5.2.4 二類別分類器之實作……………………………………………….36 第六章  實驗設計與系統分析……………………………………………………..38 6.1 資料集與文件之前處理方法……………………………………………..38 6.1.1 資料集……………………………………………………………….38  6.1.2 文件格式……………………………………………………………..39  6.1.3 文件前處理…………………………………………………………..39 6.2 以人工判定系統好壞……………………………………………………...40 6.3 與不同方法之效能比較…………………………………………………...42 6.4 與不同系統之效能比較…………………………………………………...43 第七章 結論及未來展望…………………………………………………………....44 7.1 結論…………………………………………………………………………44 7.2 未來展望……………………………………………………………………44 相關參考文獻………………………………………………………………………..46

    [1]J. Ding, D. Berleant,D. Nettleton and E. Wurtele, “Mining Medline:Abstract,Sentence
    ,or Phrases?”, Pacific Symposium on Biocomputing 7 2002,pp.326-337.
    [2]M.E. Maron,“AutoMatic Indexing: An Experimental Inquiry”, Journal of the ACM, vol.10, no.1, 1961, pp.404-417.
    [3]H. Borko and M. Bernick,“Automatic Document Classification”, Journal of the ACM, vol.10, no.1, 1963, pp.151-162.
    [4]D.F. Specht,“Probabilistic Neural Networks”, Neural Networks, vol.3, 1990, pp.109-118.
    [5]A. McCallum and K. Nigam,“A comparison of event models for Naïve-Bayes text classification.”,AAAI-98 Workshop on Learning for Text Categorization, 1998. 
    [6]E.H. Han,G. Karypis and V. Kumar,“Text categorization using weight adjusted K-nearest neighbor classification.”, Technical report, Dept. of CS, University of Minnesota. 62.
    [7]C. Apte, F. Damerau, and S. M. Weiss,“Automated learning of decision rules for text classification.”, ACM Transactions on Information Systems 1994. IBM Research Report RC18879.
    [8]M. Craven,“Learning to extract relations from Medline.”, AAAI-99 Workshop on Machine Learning for Information Extraction - July 19, 1999, Orlando Florida.
    [9]A. Bairoch and R. Apweiler,“The SWISS-PROT protein sequence data bank and its supplement TrEMBL in 1999.” Nucleic Acids Res. 27, pp.49–54.
    [10]M. Deng,K. Zhang,S. Mehta,T. Chen and F. Sun,“Prediction of protein function using protein-protein interaction data.”, IEEE Computer Society Bioinformatics Conference (CSB'02).
    [11]H. Yu and E. Agichtein, “Extracting synonymous gene and protein terms from biological literature.”, vol. 1, no.1, 2003, pp.1-10.
    [12]J. Allan,R. Papka and V. Lavrenko, “On-line new event detection and tracking.”, Proc. SIGIR Intl. Conf. Information Retrieval, 1998.
    [13]E. Riloff,“Automatically constructing a dictionary for information extraction tasks.”, Proceedings of the Eleventh National Conference on Artificial Intelligence, 1993.
    [14]M. Craven and J. Kumlien, “Constracting biological knowledge bases by extracting information from text sources.”, Proc. 7th International Conference on Intelligent Systems for Molecular Biology 1999.

    下載圖示 校內:立即公開
    校外:2003-08-07公開
    QR CODE