研究課題/領域番号 |
17K18505
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
|
研究分担者 |
藤本 灯 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 助教 (20733017)
大西 拓一郎 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 教授 (30213797)
新野 直哉 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 准教授 (30218086)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 准教授 (90415612)
|
研究期間 (年度) |
2017-06-30 – 2019-03-31
|
キーワード | 学術用語 / オントロジー / 古辞書 / 方言地図 / 言語記事 |
研究実績の概要 |
1.まず,国立国語研究所の「日本語研究・日本語教育文献データベース」(224,207件)の提供を受けることができたので,その分析を始めた。その中には185,983件の雑誌論文が含まれているが,そのうち,キーワードが付けられているのは,68,229件(約36.7%)にとどまることが分かった。このデータを使って,日本語教育の研究動向をキーワードから分析したものを日本語教育世界大会2018に投稿した(結果は不採択)。 2.データベースを構成するデータのうちの1つである,古辞書のデータについては,『哲学字彙』のデータの提供をうけることができたため,それを使って後述の語彙素への分割を試みた。また,『和名類聚抄』の和名のデータを整備している。言語地図のデータは,6冊の言語地図集をジオタグ付きの画像が表示される形で公開した。言語記事についてはサンプリングにより記事を取得する方針を決め,大正期の読売新聞,大正~昭和初期の『文芸春秋』を対象とすることにした。 3.各データベースの連携は形態素解析用辞書UniDicの語彙素を利用する。UniDicは現代語も古語にも対応し収録語も多く最適と考えられる。ただし,長い複合語が含まれていないため,そのような場合は短く分割して語彙素を充てていくことになる。また,『哲学字彙』に含まれている訳語などはその語定着しなかったものもあり,UniDicには登録されていない,これらをどのように扱うかが課題である。 4.データベースを表示するツールとしてトピックマップの利用を検討したが,技術的な問題があることが分かり,断念した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
科研費の採択決定が7月で,そこから作業者を探したが適任な人が見つからず,採用を断念した。そのため,情報整理,情報付与の作業が遅れたため。
|
今後の研究の推進方策 |
データベースのプロトタイプを年度の前半には作成し,試験公開を目指す。
|
次年度使用額が生じた理由 |
平成29年度に作業者を雇用する予定であったが,科研費の採択が7月であったため,適任の人が見つからず雇用を見送った。そのため,人件費として予定していた分を次年度に回すことにした。
|