2016 Fiscal Year Research-status Report
多様な読み手のための単語難易度指標指標の統計的構築手法の開発
Project/Area Number |
15K16059
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
江原 遥 国立研究開発法人産業技術総合研究所, 人工知能研究センター, 研究員 (60738029)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 単語難易度 / 単語親密度 / 回帰 / 項目反応理論 / 確率モデル / 機械学習 / 人工知能 |
Outline of Annual Research Achievements |
本研究の目的は,「理系学生が学ぶべき英単語の列挙」や「難しい日本語の簡単な英語への翻訳」などの第二言語学習者支援のための単語難易度指標の統計的構築方法を開発することである.具体的には,専門分野の考慮や,言語間での単語難易度の比較を可能とする単語難易度モデルを構築する. 本年度の目標は,「読み手集合を特徴に分解する分解モデル(例えば,日本語を母語とする英語学習者を,英語学習者+日本語母語話者といった特徴に分解する)」と全モデルの統合である. 本年度は,この分解モデルに関する研究を行い,本年度末に行われた言語処理学会にて発表した.母語話者を対象にした調査ではあるものの,言語心理学分野では,読み手の単語に対する親密度や,単語が意味するものをどの程度の度合いで想像できるか,といった言語心理学的指標の大規模調査が行われており,言語資源なども整備されている.そこで,この研究では,これらの指標を専門分野ごとの特徴に分解し,各専門分野が指標の値の予測にどの程度貢献しているかを計測する手法を提案した.この手法は,用いるデータを母語話者を対象にしたデータから第二言語学習者を対象にしたデータに変更すれば,そのまま本研究課題に適用可能である. 全モデルの統合についても,「読み手が知っている単語を推定するモデル(単語推定モデル)」は,これまでの研究成果で得られているので,困難なく実現できるめどがついた. また,既に前年度の論文採択時に業績に含めたので再度の記載は行わないが,本研究に関連する研究が,人工知能分野におけるトップ国際会議(査読付き)であるThe 25th International Joint Conference on Artificial Intelligence (IJCAI-16)に採択されており,本年度内に発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度は,当初からの目標であった,「読み手集合を特徴に分解する分解モデル(例えば,日本語を母語とする英語学習者を,英語学習者+日本語母語話者といった特徴に分解する)」を提案することができた.さらに,全モデルの統合にもめどがついたため,おおむね順調に進展していると言える.
|
Strategy for Future Research Activity |
本年度作成した「読み手集合を特徴に分解する分解モデル(例えば,日本語を母語とする英語学習者を,英語学習者+日本語母語話者といった特徴に分解する)」について,継続して論文を査読付き国際会議に投稿する. また,これまでに提案した全モデルを統合し,論文やシステムの形で公開することを目指す.
|
Causes of Carryover |
本研究の内容で平成28年度後半に重要な実験結果が得られたことにより,平成29年度の査読付き国際会議や論文誌に論文を投稿するめどがたった.したがって,さらに追加実験を行い,論文執筆・投稿を行うことにより,補助事業の目的を精緻に達成するため,延長を行ったため.
|
Expenditure Plan for Carryover Budget |
必要な参考図書・文献の購入,情報収集のための国内・国際会議の参加にかかる費用,追加実験のためのデータ取得,論文執筆や投稿にかかる英文校正や別刷代などの目的で主に使用する.
|