Research Abstract |
我々は,人間の言語及び知識獲得能力の解明とその実現を目的として研究を行なっている.このような研究はこれまでいくつか存在するが,工学的に有効なシステムを完成するまでに至っていないのが現状である.このような問題に対して,我々は,本研究でこの言語及び知識獲得能力を工学的に実現する一つの試みとして,入力べた書き文とその漢字かな混じり文より帰納的に語の読みと表記を獲得し,その獲得状況及び変換精度に基づく確実性の高い語より順に変換するという帰納的学習によるべた書き文のかな漢字変換手法を提案し,その有効性を確認するための実験を行った.本手法は,変換処理,学習処理,フィードバック学習処理の三つの部分より構成される.変換処理では,べた書き文が入力されるとそれまでの学習により獲得された語によって語の当てはめが行なわれる.学習処理では,入力べた書き文と校正済みの変換結果より共通部分を手掛りに語候補を得る.次に,この語候補同士の共通部分と差異部分を抽出することにより語を獲得する.最後にフィードバック学習処理では,変換結果と校正された変換結果を比較することにより正しく変換した語と誤って変換した語を決定し,正しく変換した語の尤度を上げ,誤って変換した語の尤度を下げる.本手法は辞書が空の状態からでも学習機能により語を獲得することができるので,辞書を個人毎に自動的に作成することが可能,個人用辞書とすることにより辞書容量を少なくできる,未登録語の自動登録が可能,初期辞書作成の労力を回避できるという利点がある.本年度は,本手法に基づく実験システムを作成し,異なる4分野の論文40編を用いて本手法の学習機能による適応性能を確認するための実験を行なった.実験の結果,4分野すべてにおいて90%以上の精度が得られ,べた書き文のかな漢字変換における本手法の有効性が確認された.
|