2006 Fiscal Year Annual Research Report
大規模日本語連想語データベースの構築・利用による語彙知識のマッピング
Project/Area Number |
18500200
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
JOYCE T.A 東京工業大学, 大学院社会理工学研究科, 研究員 (20418677)
|
Keywords | 大規模日本語連想データベース / 語彙知識 / マッピング / 質問紙調査・Web調査 / 語彙連想マップ / バイリンガル語彙マップ / 意味ネットワーク / グラフクラスタリング方法 |
Research Abstract |
平成18年に行った主な課題として以下の点が挙げられる。 1)Joyce(2005a)は、連想語に関する質問紙調査を行い、約1500名の大学生から連想反応を収集した。この連想反応データを整理して、Japanese word association databaseの第一版として公開するため、2,100のターゲット単語に対して連想された単語の集合を、連想種類によってコード化し、集合での延べ数・異なり数を集計し統計的データを示した。 2)大規模日本語連想語のデータベースをより効率的に構築するために、Webを用いた質問フォーマットを作成した。それを利用したWeb調査から、約150名の日本人の回答者による連想反応を収集した。 3)Joyce(2005a)が行った質問紙調査とWeb調査から収集したデータ(約53,300の連想反応)の整理は、ほぼ完了予定である。 4)語彙知識を体系的に把握することを目的とし、本研究で行っている語彙連想マップを完成するため、逆連想と連想語の集合内における結合性に関するデータを得る必要がある。そのため、調査対象コーパスを8,000〜10,000項目程度まで増加する必要があり、適切な項目を抽出するために、調査対象コーパスの中からコーア1,000項目を選択した。 5)語彙マップの発展・応用を検討する研究として、専門語の学習方法におけるバイリンガル語彙マップの有効性を示唆する結果が得られた。 6)語彙知識を捉えるもう一つの方法として、意味ネットワークが特に有効であると考えられる。グラフクラスタリング方法による分析結果および、JWADの連想語データに基づいた意味ネットワークは、スケールフリーとスパース性の構造的な特徴を持っていることが明らかになった。
|
Research Products
(4 results)