本研究では、画像および画像処理に関する経験的知識を自然言語で表現することを目的として、文献中で用いられている画像やその処理に関する語彙の抽出と意味的分類を行なった。対象とした文献は、電子情報通信学会の過去5年間に報告された論文誌中の画像処理に関係する約100の論文である。まず、内容がほぼ理解できる程度の文章や句を論文中から抜き出し、漢字仮名交じり文として計算機に入力した。続いて句読点や特定の助詞を基に漢字のみからなる名詞や外来語をプログラムによって取り出し、名詞辞書を作成した。また、助詞や助動詞、語尾活用などについては予め辞書を作成しておき、最長一致法により辞書に登録されていない語を切り出した。この未登録語をさらに分類し、初期の切り出しで得られなかった名詞やその他の品詞について分類を行なって語彙デ-タベ-スを作成した。その結果、上記の文献数に対して、名詞、形容詞、形容動詞がそれぞれ約3600語、65語、190語、また動詞と副詞が約390語と70語という数であった。対象文献数が少なく実用的な語彙登録数には至っていないが、基礎的な実験を行なうためには十分であると考えられる。現在、意味素を導入してこれらの語彙の意味的分類を行なっている。この作業と並行して、オブジェクト指向による画像処理エキスパ-トシステムを作成した。このシステムは、コモンリスプ上でオブジェクト指向を実現するために提唱されたCLOSに準拠しており、しかも画像処理を効率的に実行することが可能である。このエキスパ-トシステム上で、顔画像解析システムを構築した。モデルの記述が容易であることや知識を用いた推論による解析などを効率的に行なうことができるなど、システムの有効性を確認した。今後は、語彙デ-タベ-スと結合させてモデルや画像処理に関する知識の表現を日本語で行なう研究を継続して行なっていく予定である。
|