2003 Fiscal Year Annual Research Report
ゲノム分野におけるオントロジーを基にした知識自動獲得と知識の構造化に関する研究
Project/Area Number |
15700243
|
Research Institution | The University of Tokyo |
Principal Investigator |
美馬 秀樹 東京大学, 大学院・工学系研究科, 助手 (30359658)
|
Keywords | 知の構造化 / 自然言語処理 / バイオインフォマティックス / 情報抽出 / 用語認識 / クラスタリング / ターミノロジー / オントロジー |
Research Abstract |
本研究の目的は、ゲノム分野やナノテクノロジー、またインターネットのように、今後、さらに知識資源が増加すると考えられる分野において、知識の量と質の問題を如何に解決するかにある。具体的には、知識が膨大であるがゆえの意図する知識の検索困難性や、(専門)用語の不統一性等を指すが、平成15年度においては、主に、これらの問題に対する基礎技術と基盤システムの設計、その実現を指向した知識獲得、知識発見等の知識抽出手法、情報抽出、及びオントロジー構築に関する基礎的研究を行う予定であった。 これらの予定において、本年度は、基盤システムとして、膨大に存在する知識の管理と構造化を行うシステムの実現のためのシステム設計とプロトタイプの実装を行った。一般に、文献やデータベース等の知識ソースはそこに含まれる(専門)用語により特徴付けられる。そこで本システムでは、入力となる知識ソースからの自動(専門)用語抽出と抽出した用語の自動分類、さらに用語の分類情報に基づいた知識の類似度計算を行い、知識間の意味的な類似性を定量的に算出する。そして、ユーザより与えられたキーワードに関連する知識ソース群を、その類似性に基づいて最適配置し、視覚化を行うことで、関連する知識全体の構造を俯瞰することが可能となる。実装を行ったプロトタイプシステムに、ゲノム領域の論文アブストラクト、ナノテクに関する特許と論文、水資源に関する報告、さらには大学の授業におけるシラバス等の知識を入力し、実際に視覚化を行うことで、本システムが知識の構造化(知識の関連性の発見による新たな知の発見)に有用であることを確認した。 以上のように、本年度においては概ね計画に基づき研究を進めることができたと思われる。今後、さらなるケーススタディ、および評価を行うことでシステム、およびモデルの有効性、スケーラビリティを検証すると共に、実際のネットワーク上や、協力企業等での実稼働による試験稼働を進めることで、システムの頑健性を高める予定である。
|
Research Products
(4 results)
-
[Publications] Hideki Mima, Taesung Yoon: "A Methodology for Ontology-based Knowledge Acquisition and Structuring in an Industry-Academic-Government Project "Go Japan!""Proceedings of u-Korea Conference. 197-203 (2003)
-
[Publications] Hideki Mima, Yasuaki Takebe, Hideto Tomabechi: "An Efficient Information Retrieval Technique for P2P Content Sharing Systems"Proceedings of The first International Joint Conference on Natural Language Processing (IJCNLP). (to appear). (2004)
-
[Publications] 美馬 秀樹, 竹辺 靖昭, 苫米地 英人: "次世代P2Pコンテンツ交換システム-コンテンツの整合性維持と高度な情報検索の実現-"第11回情報処理学会DPSワークショップ論文誌. In printing. (2003)
-
[Publications] Hideki Mima: "A System for Terminology-based Knowledge Structuring"LTI Seminar, Language Technology Institute(講演). (2003)