研究概要 |
本研究は,Seidenberg & McClelland(1989)が提案した語彙処理の枠組みを基に,日本語の読みに関する脳型情報処理モデルを構築し,我が国における失読症の発現メカニズムを明らかにすることを目的とする.モデルは人工的ニューラル・ネットワークで構築されるシミュレーション・モデルであり,処理要素であるユニット集合上に表現される文字形態,音韻形態,意味の各表象が双方向的に計算される過程により,単語の音読や理解が成立する. 最終年度は,モデルで用いる単語の意味の表現法について再検討した.昨年度までに構築してきたネットワークでは,約2,000の意味特徴のオン・オフ・パターンで各単語の意味を表現していた.ところがこの意味表現では次元数が非常に多いため,莫大な学習時間を要した.これに対し近年,次元圧縮技術により,比較的低次元で意味を表現する手法がいくつか提案されている.例えばLSA(潜在的意味解析:e.g.,Landauerら,1998)では,単語間の意味的な相関関係を保ちつつ,行列の特異値分解により次元を圧縮している.今回,この次元圧縮法をこれまでに用いてきた意味表現に適用したところ,約2,000から800に次元圧縮しても単語間の意味関係は比較的よく保たれることが分かり,本手法の有効性が確認された.残念ながら,補助金交付期間内に,この意味表現を用いたモデルの構築はできなかったが,今後のモデル研究に関する有用な指針を得ることができた.
|