1.国語辞典の意味記述本文の構文的解析から、知識表現を取り出すことを昨年度に引き続き行った。 (1)昨年度は概念の上下関係を本文から抽出できるものが、少数にとどまったことをうけ、今年度、単なるタイポロジーとの区別を自動的に行う方策を探ったが、該当率が50%内外に留まり、人手を介さずに行うことが難しいことが判明した。(2)当初計画の形容詞対による意味場分類も、同様に少数にとどまった。(3)新たに、少数の基本動詞による、意味役割の推定を行ったが、基本動詞の多義性を克服するまでには至らなかった。(4)「人物」6500人強をモデルケースとして、国語辞典記述の本文の構文・語構成法を形式化した。該当率は95%以上である。(5)人物を規定することができる名詞句は、第一に職業・地位であるが、その表現は、辞典として完結していないことが判明した。見出しにその語が掲載されている割合は異なり語で5%に満たない。(6)職業・地位の複合語・派生語の意味記述は直接得られないが、使用されている主要部の形態素(漢字「者」や「家」など20字強と「天皇」などの語20語弱)と前接する形態素(「作曲」など)の意味記述から、類縁性・近親性を統計的に数値化した。(7)個々の人物の記述本文に含まれる職業・地位の等位接続(「作曲家・指揮者」などの表現)から、職業・地位の意味空間を抽出することができた。(8)職業・地位を記述する文(名詞節)に付随する情報(国・地域、時代区分・王朝など)と、その後に補足される情報(著作・事件・親族など)と、職業・地位名詞句との相関係数が得られた。(9)前3項の統合の結果、国語辞典の人物描写の意味空間を意味微分することができた。(10)「人物」について得られた方法論を、「道具」と「関係・部分」について適用する可能性を探っている。 2.見出しにたてられていない「人物」の意味記述をテキストマイニング技法により取り出し、辞書の実質的拡大をはかった。
|