2002 Fiscal Year Annual Research Report
自然言語に近い表現形式で推論機能を有する概念化学知識表現(CCR)
Project/Area Number |
13680433
|
Research Institution | The University of Tokyo |
Principal Investigator |
石塚 満 東京大学, 大学院・情報理工学系研究科, 教授 (50114369)
|
Keywords | 自然言語表現 / 知識表現 / 推論 / キーワード抽出 / 重要文抽出 / 知識共有 |
Research Abstract |
WWW上を始めとして,社会では自然言語で書かれた膨大な量のテキストが蓄積,流通するようになってきているが,自然言語を(例えば1センテンス単位で)知識表現形として捉える場合,曖昧性を排除して意味を一意に確定する自然言語理解の困難さは別にして,組み合わせて使う,即ち連鎖的な推論を働かすことが困難であるという問題がある.このような問題への一つのアプローチとして,自然言語表現に近く,1対1(一意)に近い関係で相互変換可能であり,かつ推論機能も併せ持つ知識表現形として,我々が「概念化学表現(Concept Chemical Representation (CCR))」と呼ぶ技術の研究開発を行ってきた. 自然言語文をCCR化する場合,すべてのテキスト文を対象にすることも考えられるが,主題となる記述のみに焦点を当て,その他の部分は対象から除外することは,擾乱的要素を不要に知識ベースに取り込むことを回避する意味でメリットがある.そこで,文書が述べている主題,及びそれに強く関連する文を取り出すために必要なキーワード抽出法の研究開発を行った.従来のキーワード抽出法はTF*IDFに基づく手法が中心であったが,我々はこれとは異なる以下のような複数の手法を考案,開発するという成果を得た.いずれも英語,日本語ともに適用可能である. 1)1文内での語の共起の偏りに基づく方法 2)語の共起によりグラフ構造を作成し,そのスモールワールド構造情報に基づく方法 3)人間が語を認知する活性度に基づく方法
|
Research Products
(6 results)
-
[Publications] 松尾 豊, 石塚 満: "語の共起の統計的情報に基づく文書からのキーワード抽出アルゴリズム"人工知能学会論文誌. 17・3. 217-223 (2002)
-
[Publications] 松尾豊, 大澤幸生, 石塚満: "Small World構造に基づく文書からのキーワード抽出"情報処理学会論文誌. 43・6. 1825-1833 (2002)
-
[Publications] 松村真宏, 大澤幸生, 石塚満: "語の活性度に基づくキーワード抽出法"人工知能学会論文誌. 17・4. 398-406 (2002)
-
[Publications] N.Matsumura, Y.Matsuo, Y.Ohsawa, M.Ishizuka: "Discovering Emergent Topics from WWW"Jour. of Contingencies and Crisis Management. 10・2. 73-81 (2002)
-
[Publications] N.Matsumura, Y.Ohsawa, M.Ishizuka: "Automatic Indexing for Extracting Asserted Keywords from a Document"Jour. of New Generation Computing. 21・1. 37-47 (2002)
-
[Publications] N.Okazaki, Y.Matsuo, M.Ishizuka: "Extracting Characteristic Sentences from Related Documents"Proc. 6^<th> Int'l Conf. on Knowledge-based Intelligent Information Eng. Systems. 1257-1261 (2002)