研究概要 |
本研究は,Seidenberg & McClelland (1989)が提案した語彙処理の枠組みを基に,日本語の読みに関する脳型情報処理モデルを構築し,我が国における失読症の発現メカニズムを明らかにすることを目的とする.このモデルは,人工的ニューラル・ネットワークで構築されるシミュレーション・モデルであり,処理要素であるユニット集合上に表現される文字形態,音韻形態,意味の各要素が双方向的に計算される過程により,単語の音読や理解が成立する.本年度は,このモデルに単語の意味を表現する方法を検討し,簡単なパイロット・シミュレーションを行った. 本研究では,多数の意味属性ユニットの活性化パターンで,一つの意味(あるいは概念)を表現する分散表現を採用した.この手法で単語の意味を表現するに当たり,NTTコミュニケーション科学研究所が構築したデータベース(日本語語彙大系,1997)を利用した.このデータベースには,約12万語の一般名詞が,階層的な木構造形式で約2,700の意味に分類されており,各単語(e.g.,カクテル)の意味は,木構造の終端ノード(e.g.,酒)で規定されている.ここで,終端ノードにいたるまでの意味属性間の関係から,当該単語に関連する全てのノードの組み合わせ(e.g.,具体,具体物,無生物,人工物,食料,嗜好品等,飲物,酒)で単語の意味を表現できる.本年度は,漢字語,カタカナ語,計約4,000語の意味を上記の方法で符号化した. また,単語の文字形態から意味を計算する過程における表記の影響について,簡単なシミュレーション実験を試みた.モデルは,上記約4,000語の文字形態からその意味を計算するもので,文字形態には各単語のグリッド・パターン,意味には上記の手法により符号化したパターンを用いた.シミュレーションの結果,漢字語の処理時間は仮名語より速かった.これは,漢字は意味を表す文字であるため,文字から意味を計算する過程では仮名語より漢字語の計算効率が良くなるという予測と一致した.
|