良質な用例を大規模なコーパスから自動的に抽出できるモデルの構築および試作版の開発

研究課題

研究課題/領域番号	18F18808
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	外国
審査区分	小区分02090:日本語教育関連
研究機関	大学共同利用機関法人人間文化研究機構国立国語研究所
研究代表者	PARDESHI P.V. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)
研究分担者	HMELJAK MARIJA 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 外国人特別研究員
研究期間 (年度)	2018-11-09 – 2020-03-31
研究課題ステータス	完了 (2019年度)
配分額 *注記	700千円 (直接経費: 700千円) 2019年度: 400千円 (直接経費: 400千円) 2018年度: 300千円 (直接経費: 300千円)
キーワード	example sentences / learners' dictionary / lexicography
研究実績の概要	The aim of this project was to develop a model for selecting pedagogically valid Japanese example sentences from a general corpus, by investigating automatically measurable criteria of readability, typicality and informativity. We collected example sentences from learners' dictionaries, reference works, graded readers and learner corpora, and constructed a graded corpus of example sentences, to be used as a data set for verifying the usabililty of existing readability formulas on single sentences or short usage examples for learners of Japanese as a foreign language. We experimented using existing readability formulas on these graded example sentences, and found that while the formulas work well for longer texts, they are not applicable to single sentences. We further annotated a set of sentences extracted from a web corpus, manually scoring their readability and informativity for learners of Japanese as a foreign language, to investigate measurable criteria of readable and informative sentences. The analysis of these criteria is still in progress. We are currently exploring possible interfaces to the corpus of constructed single example sentences and the annotated set of sentences extracted from texts to be used by learners, teachers and lexicographers of Japanese as a foreign language.
現在までの達成度 (段落)	令和元年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和元年度が最終年度であるため、記入しない。

報告書

(2件)

2019 実績報告書
2018 実績報告書

研究成果
(3件)

すべて 2020 2019

すべて雑誌論文 (3件) (うちオープンアクセス 2件)

[雑誌論文] 第9章　日本語学習者の読解過程における辞書使用2020
- 著者名/発表者名
  クリスティーナ・フメリャク寒川
- 雑誌名
  
  日本語学習者の読解過程
  
  巻: 1 ページ: 165-182
- 関連する報告書
  2019 実績報告書
[雑誌論文] 日本語非母語話者の読解コーパス」から見える非漢字圏日本語学習者の辞書使用2019
- 著者名/発表者名
  クリスティーナ・フメリャク寒川
- 雑誌名
  
  言語資源活用ワークショップ 2019 発表論文集
  
  巻: 1 ページ: 351-358
- 関連する報告書
  2019 実績報告書
- オープンアクセス
[雑誌論文] Makrostruktura predmodernih japonskih slovarjev: kitajski vzori in japonske inovacije2019
- 著者名/発表者名
  Hmeljak Sangawa, Kristina
- 雑誌名
  
  Procesi in odnosi v Vzhodni Aziji, Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani
  
  巻: 1 ページ: 191-215
- DOI
  10.4312/9789610602699
- 関連する報告書
  2019 実績報告書
- オープンアクセス

良質な用例を大規模なコーパスから自動的に抽出できるモデルの構築および試作版の開発

研究代表者

PARDESHI P.V. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)

700千円 (直接経費: 700千円)

報告書

研究成果

[雑誌論文] 第9章 日本語学習者の読解過程における辞書使用2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 日本語非母語話者の読解コーパス」から見える 非漢字圏日本語学習者の辞書使用2019

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Makrostruktura predmodernih japonskih slovarjev: kitajski vzori in japonske inovacije2019

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 第9章　日本語学習者の読解過程における辞書使用2020

[雑誌論文] 日本語非母語話者の読解コーパス」から見える非漢字圏日本語学習者の辞書使用2019