研究課題/領域番号 |
15H03216
|
研究機関 | 長岡技術科学大学 |
研究代表者 |
山本 和英 長岡技術科学大学, 工学研究科, 准教授 (40359708)
|
研究分担者 |
松田 真希子 金沢大学, 国際機構, 准教授 (10361932)
森 篤嗣 帝塚山大学, 現代生活学部, 准教授 (30407209)
岩田 一成 聖心女子大学, 文学部, 准教授 (70509067)
茂木 俊伸 熊本大学, 文学部, 准教授 (20392540)
中俣 尚己 京都教育大学, 教育学部, 准教授 (00598518)
内丸 裕佳子 岡山大学, 言語教育センター, 准教授 (00550964)
建石 始 神戸女学院大学, 文学部, 准教授 (70469568)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | 自然言語処理 / 形態素解析 / 誤用 |
研究実績の概要 |
(1)日本語解析システム「雪だるま」のプロトタイプを作成し、一部ユーザーに向けて試験公開した。 (2)日本語解析システム「雪だるま」に対し、敬語の除去モジュール、支援動詞のサ変動詞への変換モジュール、及びひらがな単語の漢字語への換言モジュールを作成し、いずれも試験公開した。 (3)日本語解析システム「雪だるま」を用いて単語体系の機械翻訳性能への影響について調査を行った。また、同システムを用いて『日中Skype会話コーパス』の語彙分析を行った。 (4)日本語誤用のデータ収集を開始した。どのような情報を付与したデータを作成するべきかについて検討を行い、実際に試験的な誤用データ収集を開始した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
項目(1)について、予定よりも早い段階でシステムを試験公開しながらシステムの改良を行うこととし、予定よりも早い段階での試験公開に踏み切った。ただし、改善すべき点は非常に多いので、システムの完成度という意味では当初予定していた程度の進捗となっている。 項目(2)について、当初予定になかった様々な付加モジュールを作成することでき、当初予定していた以上の成果を得ることができた。 項目(3)について、システムを予定よりも早く試験公開できたことで、これを用いた様々な調査や分析を行うことが可能となった。 項目(4)について、まだ試験的ではあるが日本語誤用データを試験的に収集開始することができた。
|
今後の研究の推進方策 |
日本語解析システム「雪だるま」は予定よりも早い公開を実現することができたが、まだ辞書の整備は始まったばかりであり、改善すべき点は非常に多いと認識している。その意味においてこれからがプロジェクトの正念場であり、今後はこれら問題点に対して一つずつ時間をかけて辞書の改善を試みていきたい。 また、早期に試験公開できたことを活かして、システムをできるだけ多くの日本語教育関係者に使ってもらい、利用者の様々な声を集めることも注力したい。
|