2006 Fiscal Year Annual Research Report
Project/Area Number |
18700136
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
野呂 智哉 東京工業大学, 大学院情報理工学研究科, 助手 (80401553)
|
Keywords | 日本語 / 定義語彙 / 辞書 / 言語資源 / 言語教育 |
Research Abstract |
岩波国語辞典(第五版)を利用し,語釈文に使用されている語の分布をもとに,以下の手順に沿って日本語定義語彙に採用する語の候補をリストアップした. 1.岩波国語辞典中の見出し語とその語釈文中の各語との対応関係をグラフで表現する.具体的には,語の読み,正書法による表記,品詞の3つ組でノードを区別し,見出し語からその語釈文中の各語に向けて有向枝を付与することにより,グラフを構築する. 2.構築したグラフをもとに,各語に対してスコア付けを行い,スコアの高い語を候補語とする.具体的には,Webページ検索における検索結果の順位付けなどで用いられるPageRankにもとづきスコア付けを行う. 従来の「基本語彙」に関する各種の研究は,主として日本語学習者(児童や外国人)が知っている(べき)語,辞書に見出し語として登録すべき語に関するものであり,本研究が対象とする「定義語彙」とは異なると予想していたが,予想通りの結果を見出すことができた. 次年度は,以下の分析・検討を行う予定である. 1.リストアップされた候補語について,さらに詳細な分析を行う.基本語彙との相違,候補語の特徴についていくつかの観点から分析を行う. 2.定義語彙のサイズに関する検討を行う.英語では2000〜3000語の定義語彙で語釈の記述が可能であることが分かっているが,日本語ではどのくらいの語数が必要かの検討を行う. 3.構築した定義語彙にもとづき,語釈の記述を試みる.その際,限られた語彙で語釈を記述するための方針について検討を行う.
|
Research Products
(2 results)