研究課題/領域番号 |
13878060
|
研究種目 |
萌芽研究
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 北海道大学 |
研究代表者 |
小野 芳彦 北海道大学, 大学院・文学研究科, 教授 (20126022)
|
研究期間 (年度) |
2001 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
1,500千円 (直接経費: 1,500千円)
2002年度: 700千円 (直接経費: 700千円)
2001年度: 800千円 (直接経費: 800千円)
|
キーワード | テキスト・マイニング / 国語辞典 / 認知意味論 / 数量化理論IV類 / 意味微分 / セマンティックネットワーク / 意味空間 / 語構成規則 / 本文 / 知識ベース / 構文規則 / ハイポニミー / タクソノミー |
研究概要 |
1.国語辞典の意味記述本文の構文的解析から、知識表現を取り出すことを昨年度に引き続き行った。 (1)昨年度は概念の上下関係を本文から抽出できるものが、少数にとどまったことをうけ、今年度、単なるタイポロジーとの区別を自動的に行う方策を探ったが、該当率が50%内外に留まり、人手を介さずに行うことが難しいことが判明した。(2)当初計画の形容詞対による意味場分類も、同様に少数にとどまった。(3)新たに、少数の基本動詞による、意味役割の推定を行ったが、基本動詞の多義性を克服するまでには至らなかった。(4)「人物」6500人強をモデルケースとして、国語辞典記述の本文の構文・語構成法を形式化した。該当率は95%以上である。(5)人物を規定することができる名詞句は、第一に職業・地位であるが、その表現は、辞典として完結していないことが判明した。見出しにその語が掲載されている割合は異なり語で5%に満たない。(6)職業・地位の複合語・派生語の意味記述は直接得られないが、使用されている主要部の形態素(漢字「者」や「家」など20字強と「天皇」などの語20語弱)と前接する形態素(「作曲」など)の意味記述から、類縁性・近親性を統計的に数値化した。(7)個々の人物の記述本文に含まれる職業・地位の等位接続(「作曲家・指揮者」などの表現)から、職業・地位の意味空間を抽出することができた。(8)職業・地位を記述する文(名詞節)に付随する情報(国・地域、時代区分・王朝など)と、その後に補足される情報(著作・事件・親族など)と、職業・地位名詞句との相関係数が得られた。(9)前3項の統合の結果、国語辞典の人物描写の意味空間を意味微分することができた。(10)「人物」について得られた方法論を、「道具」と「関係・部分」について適用する可能性を探っている。 2.見出しにたてられていない「人物」の意味記述をテキストマイニング技法により取り出し、辞書の実質的拡大をはかった。
|