研究課題/領域番号 |
14580465
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 国立情報学研究所 |
研究代表者 |
影浦 峡 国立情報学研究所, 人間・社会情報研究系, 助教授 (00211152)
|
研究期間 (年度) |
2002 – 2003
|
研究課題ステータス |
完了 (2003年度)
|
配分額 *注記 |
1,900千円 (直接経費: 1,900千円)
2003年度: 800千円 (直接経費: 800千円)
2002年度: 1,100千円 (直接経費: 1,100千円)
|
キーワード | 専門語彙 / 情報理論 / 計量語彙論 / ターミノロジー / 確率モデル / LNREモデル / 確立モデル |
研究概要 |
本研究では、特に専門語彙を対象に、語種の構造を計量的・情報論的に分析するためのモデル/枠組みを提案し、実際にそれを用いた分析結果を記述・予測的に提示することを行なった。より具体的には、以下である。 1.語彙論及び専門語彙論の領域の存立条件に関する理論的検討 2.語彙の構成構造を、数量的・情報論的に記述するために、テキストと語彙との関係について考察するとともに、テキストにおける語の重み付け手法を出発点として、観察店を統合的なユニットに絞り、二項補間・補外及びそれを拡張したLNREモデルを適用することで、テキストから語彙空間における語構成要素の基本的な造語力を復元するための道筋を示した。 3.専門語彙を出発点として、語種の構成構造を、単に与えられたデータに対してだけでなく、与えられたデータと構造的に同質でありながら量的に異なる場合に、構造がどのように変化するかを記述する手法の適用と、実際にいくつかの専門語彙を対象とした記述観察。計算機科学のように、直感的にも外来語の使用が定着している領域では、外来語のほうが異なり語数としては和語・漢語よりも多くなっていること、化学や心理学では、和語・漢語よりも外来語の異なり語数がわずかな語彙量の増大により多くなると予測されること、植物学や物理学では外来語の異なり語数が増えてはいるが、逆転については現実的範囲内ではどうか不明であること、農学については、和語・漢語が優勢であり続けるだろうことが観察された。 4.語種という、一見自明な概念がいかにして存立するかの批判的検討と、それに対応して、そもそも情報処理的観点からの言語操作に語種の区別が必要であるかどうかを評価するモデル/手法の検討。 これらにより、テキスト・データという、言語的には一次的なデータを出発点とした語彙論研究への一定の道筋、語彙の博物学的データ記述に留まらない動的・予測的な計量的・情報論的分析モデルの設定とそれを用いた専門語彙の語種構造の記述、語種概念の存立意義の情報論的な測定手法について、基本的な知見が得られたことになる。 その過程で、10分野の専門語彙データに対して、国立国語研究所のいわゆるM単位に基づく語基分割を行い、そのうち6分野に対しては語種情報の付与も行なった。
|