2012 Fiscal Year Annual Research Report
心内辞書と語彙ネットワークの数理モデル化による第二言語運用支援システムの研究
Project/Area Number |
12J09575
|
Research Institution | The University of Tokyo |
Principal Investigator |
江原 遥 東京大学, 大学院・情報理工学系研究科, 特別研究員(DC2)
|
Keywords | 項目反応理論 / ロジスティック回帰 / 読解支援 / 支援システム / 語彙ネットワーク / 心内辞書 / 機械学習 / 適応的学習 |
Research Abstract |
本年度の成果として、COLING2012という会議にて、論文1を発表したことが挙げられる。 その具体的内容は、「個別学習者一人にとっての単語の難易度」を推定できる新しい数理モデルを提案したことである。 申請書より、本研究の目的は、数理モデルによって心内辞書と複数のシステムを結びつけ、複数のシステムが共通して心内辞書を用いることができるようにすることである。論文1は、この数理モデル部分について以下の改良をした。 既存の数理モデル(項目反応理論の3母数モデル)では、全学習者に取って単語の難易度が同じであることが仮定されていた。そのため、学習者の語彙力以外の要因で学習者が知っている/知らない事がある語を検出する事が出来なかった。例えば、"twitter"という語は、英単語としては「ささやく」という意味の非常に難しい(低頻度な)語であるが、能力の低い英語学習者でも、Twitterというマイクロブログサービスの利用者であれば知っている事がありえる。このような語は、試験での使用に適さず予測も難しいため、システムでは除外したい。 論文1の提案モデルでは、学習者集合に対する単語の難易度の分散を測ることが出来る。この単語の難易度の分散の値が大きいということは、単語の難易度を、各学習者の能力パラメタを用いて上手く説明することが出来ないということであるので、学習者の語彙力以外の要因で学習者が知っている/知らない語をモデル化していると言える。 論文1の意義は、先述のtwitterのような語を、学習者ごとの単語の難易度の分散が大きい語として検出する事が可能となったことである。学習者の語彙知識の予測精度に関しては、既存モデルよりわずかであるが向上した。 論文1の重要性については、論文1は隔年開催の計算言語学の査読付き主要国際会議であることから、計算言語学の主要な業績として認められたと言える。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的である複数のシステムが共通して心内辞書を用いることが出来る様な数理モデルにおいて、新規な改良を行い、主要国際会議に掲載される程度の重要な業績を上げる事ができたため。
|
Strategy for Future Research Activity |
研究課題では、数理モデルの改良に語彙ネットワークを利用することを計画していたが、語彙ネットワークを用いる以前の段階で改良点が見つかったため、今年度はこちらを先に研究し、成果を上げることができた。 今年度の成果に加えて、来年度は、当初計画した語彙ネットワークをも利用する数理モデルの提案と、実際の支援システムとの接続を目指し、博士論文にまとめることを計画している。
|
Research Products
(5 results)