帰納論理プログラミング(ILP)の高性能化を実現するために、今年度はこれまでにない新しいILPの方法論を開発した。具体的には、ILPシステムへの入力として与えられる背景知識を必要十分に用意することはできないという問題を解決するために、学習精度の向上に必要な背景知識の一部を自動的に求め、これを繰り返すことで、背景知識の漸増的な構成法を提案した。これまでに背景知識の漸増的な構成に関して、実験コストを削減することを基準とした研究が行われてきた。これは学習精度の向上には寄与しない。これに対して、本方法は発想推論を援用することで、仮説の導出に直接・間接的に関わる背景知識の一部を自動的に求めることが可能であり、学習精度の向上に寄与するものである。本方法を未知事例がどのクラスに分類されるかという分類問題(特に、突然変異性であるかどうかを同定するILPの標準問題)に適用した結果、非常に少ない背景知識からでも高い予測精度を実現することに成功した。この成果は、第13回ILP国際会議Short Presentation論文集に掲載されている。 次に、ILPのもう一つの新しい方法論として、誤分類の予測と修正という研究を行った。ここでいう誤分類とは、エキスパートシステムのような経験的知識を使って分類する場合の分類先の誤りのことをいう。一般に、エキスパートシステムは専門家並みの診断や分類を行うが、その精度は100%ではありえない。本研究は、こうした点に関して、エキスパートシステムの誤分類をサポートする目的で、誤分類を事前に予測し、正しく修正するためのルールを誤分類のサンプルから生成するものである。このような研究は、これまでのILP研究にはまったくないもので、非常に独創性が高い。本方法を英単語の品詞タグ付け問題に応用したところ、この問題に対して現在利用されているBrillのタグ付けシステムよりも精度の高い分類結果を得ることができた。具体的には、Brillのタグ付けシステムは95%の高精度を達成しているが、Brillのシステムの誤分類予測・修正を行った結果、96%の精度が得られた。世界最高峰であるBrillのシステムを1%でも上回ることは本方法の有効性を実証している。この成果も第13回ILP国際会議Short Presentation論文集に掲載されている。
|