2015 Fiscal Year Research-status Report
多様な読み手のための単語難易度指標指標の統計的構築手法の開発
Project/Area Number |
15K16059
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
江原 遥 首都大学東京, システムデザイン研究科, 助教 (60738029)
|
Project Period (FY) |
2015-04-01 – 2017-03-31
|
Keywords | 単語難易度 / 項目反応理論 / 確率モデル / クラウドソーシング / 機械学習 / 人工知能 |
Outline of Annual Research Achievements |
本研究の目的は、「理系学生が学ぶべき英単語の列挙」や「難しい日本語の簡単な英語への翻訳」などの第二言語学習者支援のための単語難易度指標の統計的構築方法を開発することである。具体的には、専門分野の考慮や、言語間での単語難易度の比較を可能とする単語難易度モデルを構築する。当該年度の計画は、1)専門分野を考慮してテキストの読み手を推定する読み手推定モデルと、2)読み手が知っている単語を推定する単語推定モデルの研究である。 当該年度では、1)について、実験・評価のため、クラウドソーシングを用いて100人程度の実験協力者から、学習者の専門分野の情報をも付加した単語テストのデータ収集を行った。 2)については、言語処理学会年次大会において、単語難易度や語彙能力が語学教師の労力をかけずとも単語テストの結果から求められるとする、研究代表者のこれまでの研究成果を発表した。 さらに、情報通信研究機構での研究が主要部分を占める翌年度の研究成果ではあるが、本研究に関連する研究が、人工知能分野におけるトップ国際会議(査読付き)であるIJCAI-16に採択された。従来は、翻訳者の翻訳能力を測定するためには、試しにある程度の量の原文を翻訳してもらい、翻訳文を人手で評価する必要があり、多大な時間的・経済的コストがかかった。この研究は、翻訳者の翻訳能力を、単語テストを用いて計測した翻訳者の翻訳先言語での語彙能力を通じて計測する手法を提案するものであり、実際に、翻訳能力測定にかかるコストを削減する事に成功している。また、この研究に関連する発表を当該年度9月にNLP若手の会で行い奨励賞を受賞した。 この研究は、原言語と翻訳先言語の両言語にまたがる翻訳能力を語彙能力を通じて測定する事を可能にしており、本研究の目的の1つである「言語間での単語難易度の比較」に間接的・部分的にではあるが貢献している点で、本研究に関連している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該年度の計画は、1)専門分野を考慮してテキストの読み手を推定する読み手推定モデルと、2)読み手が知っている単語を推定する単語推定モデルの研究である。 当該年度の成果として、1)については、必要なデータ収集をクラウドソーシングを通じて行った。2)については、これまでの研究の枠組みの延長で基本的に対応でき、また、このことについて言語処理学会年次大会において発表した。 1)については読み手の推定モデルの作成の完全な完了には至っていないものの、加えて、1),2)の両方に関連する研究成果(ただし、情報通信研究機構での研究が主要部分を占める)が、人工知能分野のトップ国際会議(査読付き)であるIJCAI-16に採択された(投稿は当該年度だが、採択は翌年度)。また、この研究に関連する発表を、NLP若手の会で当該年度9月に行い、奨励賞を受賞している。 以上のことを総合し、おおむね順調に進展していると評価した。 なお、研究代表者の所属機関が、情報通信研究機構から首都大学東京を経て産業技術総合研究所に変更になっているが、研究環境の水準は大きく変わっていないため、引き続き、研究を遂行することが可能である。
|
Strategy for Future Research Activity |
当該年度の計画は、1)専門分野を考慮してテキストの読み手を推定する読み手推定モデルと、2)読み手が知っている単語を推定する単語推定モデルの研究である。また、次年度の計画は、3)読み手集合を特徴に分解する分解モデルと、全モデルの統合である。分解モデルは、例えば、日本語英語母語話者という特徴を、英語学習者+日本語母語話者といった複数の特徴に分解する。 今後の研究の推進方策は次の通りである。まず、当該年度中に取得した、クラウドソーシングからの学習者の専門分野(得意分野)をも付加した単語テストデータを活用することが可能な、1)の読み手推定モデルの開発の完了を目指す。次に、次年度の計画である3)分解モデルを開発し、全モデルの統合を目指す。そして、語学学習者の専門分野を考慮した単語難易度モデルの開発や、主要国際会議(査読付き)への投稿などを通じて、研究目的の達成を目指す。
|
Remarks |
研究代表者の個人ページにて、本研究による成果を含む研究成果一覧を公開している。
|
Research Products
(5 results)