研究分担者 |
今井 むつみ 慶應義塾大学, 環境情報学部, 助手 (60255601)
武藤 佳恭 慶應義塾大学, 環境情報学部, 助教授 (40245618)
石崎 俊 慶應義塾大学, 環境情報学部, 教授 (00245614)
有川 節夫 九州大学, 理学部, 教授 (40037221)
溝口 文雄 東京理科大学, 理工学部, 教授 (50084463)
|
研究概要 |
コンピュータによる知的発見・創造の支援に関する研究 知的な発見や創造をコンピュータによって支援するための基礎研究が、日英両国で、個々に進められてきたが、本国際科学研究では、近年機械学習の分野で注目を集めている帰納論理プログラミング、ニューラルネットワーク、および、データベースからの知識の獲得を取り上げて、その可能性の検討を日英共同で行なった。具体的には、帰納論理プログラミング研究の最新の成果であるStephen MuggletonによるPROGOLという実験システムを用いて、知的な発見や創造がどのようにしてなされるのかの検討を試みた。その結果、PROGOLに与える背景知識に新述語を導入することによって、高階概念の学習や、アナロジーの導入が可能であることが明らかとなった。また、それらのシステムを用いて、如何にしてデータベースから知識を獲得できるかについて、予備的検討を行なった。そして、データベースからの知識の獲得のためには、データベース情報の適当な加工と、適切な負事例、背景知識の付与の重要性が明らかとなった。さらに、大規模データに対処するため、処理速度の向上が、不可欠であることが明らかとなった。そして、それを実現するために、並列アルゴリズムの検討を行なった。 実験や観測で得られた事実からの学習アルゴリズムに基づく科学的発見においては,仮説空間の事実による反駁可能性が,基本的であることを究明して,そうした事実からの機械発見の数学的理論を構築した.この仮説空間の反駁可能性は,K.Popperの科学的発見の論理における仮説/理論の論駁可能性と好対照をなすものである.この研究において論駁可能で十分広い仮説空間が存在することを証明した.また,説明に基づく一般化の概念を,カットを含む一般のPrologプログラムに適用できるように一般化して,プログラム再利用の新しい理論を展開した.さらに,機械学習アルゴリズムをたんぱく質データに応用し,分子生物学における重要な知識の機械発見に成功した. データベースからの知識の獲得では、人間用の辞書の電子化である電子化辞書を対象にしてコンピュータによる知識の獲得を検討した。電子化辞書における意味記述である語釈文をコンピュータが自動的に理解することが難しいため、むしろコンピュータ用に語や概念の意味を辞書として用意し、それを背景知識(常識)としてコンピュータが使用することによって、データベースからの知識獲得に役立てることが必要であることが分かった。帰納論理プログラミングの拡張については、2つの研究課題に取り組んだ。第一は帰納論理プログラミングにおける扱いが従来難しかった高階概念の学習を、汎最小汎化のアルゴリズムを導入することによって検討した。さらに、PROGOLに与える背景知識に新述語を導入する方式の検討をも行なった。その結果、この両者が同じ結果をもたらすことを確認した。第二は、自然言語処理への応用で、英語のbreakに関する意味領域の日本語動詞(壊れる、折れるなど)がどのような性質の名詞を目的語としてとりうるか、又はどのような性質の名詞が目的語として不適当かを、認知心理実験でとられた名詞と動詞のシステマティックな組み合わせの評定値のデータから学習し、更に新しい事例(つまり新奇な名詞)が、その動詞の目的語としてどれだけ適当かを判断する機械学習システムの開発に従事した。この際、C4.5とPROGOLのこの問題への応用可能性をあわせて検討した。
|