研究課題/領域番号 |
15H03210
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
PARDESHI P.V. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)
|
研究分担者 |
岸本 秀樹 神戸大学, 人文学研究科, 教授 (10234220)
野田 尚史 大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究領域, 教授 (20144545)
吉本 啓 東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
窪田 悠介 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 准教授 (60745149)
長崎 郁 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70401445)
バトラー アラステア 弘前大学, 人文社会科学部, 准教授 (90588873)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | 関係節 / 従属節 / アノテーション / 統語・意味解析 |
研究実績の概要 |
本研究は現代日本語の特徴の一つである関係節および従属節を中心とする複文について言語学的情報を検索、抽出するために必要なアノテーション方法を研究し、それに基づいて約5万文(約90万語)に対してタグ付け作業を行い、複文に関するより高度の環境整備を整えることを目標とする。この作業は国立国語研究所の「統語・意味解析コーパスの開発と言語研究」プロジェクトと連携をしながら進め、以下の成果があった。
① コーパス構築:4万文規模のコーパスの公開(国立国語研究所のウェブサイトを通じて、http://npcmj.ninjal.ac.jp/)
2020年3月末時点では40,831文、560,098語数規模のコーパスが開発・公開された。また、このコーパスを検索するために初級者から上級者向けの複数の検察ツール(インターフェース)を開発し、公開した。(2020年1月のアクセス統計:ユーザー数152,594、ページビュー数256,774(Google Analytics統計)。また、この研究の成果を一部利用して、「日本語文型バンク」(日本語教育に必要な文型を難易度により分類し、一つ一つの文型に多数の用例と音声ファイルを付与したデータベース)が開発され、公開された。(http://bunkeibank.ninjal.ac.jp/)。
|
現在までの達成度 (段落) |
令和元年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和元年度が最終年度であるため、記入しない。
|