研究課題/領域番号 |
12J09575
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
江原 遥 国立情報学研究所, コンテンツ科学研究系, 特別研究員(PD)
|
研究期間 (年度) |
2012 – 2013
|
研究課題ステータス |
完了 (2013年度)
|
配分額 *注記 |
1,800千円 (直接経費: 1,800千円)
2013年度: 900千円 (直接経費: 900千円)
2012年度: 900千円 (直接経費: 900千円)
|
キーワード | 項目反応理論 / ロジスティック回帰 / 読解支援 / 支援システム / 語彙ネットワーク / 心内辞書 / メンタルレキシコン / 機械学習 / 適応的学習 |
研究概要 |
本研究の目的は、数理モデルによって心内辞書と複数のシステムを結びつけ、複数のシステムが共通して心内辞書を用いることができるようにすることである。最終年度である平成25年度は、研究代表者の本研究に関連する成果を博士論文にまとめた。博士論文では、「数理モデル」部分に「言語テスト手法」を対応させ、「システム」部分に「第二言語使用の支援システム」に対応させた。既存の英文校正や読解支援などの「第二言語使用の支援システム」の研究では、各システムが扱うタスク毎に個別的に論じられており、タスクを超えて、どのような言語テスト手法が適用しやすいかを論じた統一的なフレームワークは存在しなかった。博士論文では、システムのユーザの間のやりとりをThree-handshake Modelとしてモデル化し、どのようなタスクを扱う第二言語使用の支援システムに言語テスト手法が適用しやすいのかについて、統一的に論じた。 平成25年度の課題になっていた、語彙ネットワークをも利用する数理モデルの提案については、語彙ネットワークから、グラフ上の能動学習手法を用いて、学習者の語彙力を計測するために適切な語彙の集合を取り出す手法を提案・実験・論文執筆し、これを投稿中である。 また、言語教育への応用ではないが、関連語抽出のタスクにおいて、語彙ネットワークからラベル付けすべき語を提示し、人間にラベルを付けてもらう過程を逐次的に繰り返す形式の新たな能動学習手法を提案した。この手法は、将来的に、学習者の心内辞書を少量の語彙テストだけで計測する事につながるものである。この論文は、グラフを用いた自然言語処理の代表的なワークショップである、TextGraphs-8(自然言語処理の主要国際会議EMNLPに付属)に採録された(研究発表(1)-1)。 その他、学習者の語彙力から、ネットワーク上の友達関係を予測する手法も提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は、心内辞書と複数の第二言語の運用支援システムを結びつける数理モデルを開発する事である。この数理モデル部分に、項目反応理論をいかに適用できるかについて、博士論文にまとめる事ができた。運用支援は、大別して読解支援と作文支援に分けられる。このうち、読解支援については、具体的に数理モデルと結びつけたシステムを開発し、研究として評価する所まで達成する事ができた。作文支援については、具体的なシステムの開発にまでは至らなかったが、作文支援におけるタスクのうち、どのようなタスクにおいて数理モデルが適用しやすいかを条件付け、博士論文にまとめる事ができた。
|
今後の研究の推進方策 |
今後の研究の推進方策としては、まずは、得られた研究成果を、論文やホームページなどで対外発表していく事が挙げられる。特に、平成24年度に採択された自然言語処理の主要国際会議_ING 2012の内容を、正則化項をさらに工夫するなどして論文誌としても投稿する事を詐画している。また、今まで、本研究での対外発表は知能情報学分野の会議が中心であったが、本研究の内容をまとめ、文系の言語教育分野の国内会議などでも発表し、成果を広めていく。ホームページでは、論文の公開とともに、本研究で作成したプログラムや、語彙ネットワークのデータも整理し、公開していく。 研究成果の今後の進展としては、支援システムを通じて学習者の語彙力(能力)を計測する技術・知見を、翻訳支援やクラウドソーシングなどの、作業者の言語能力が直接関わる知能情報学分野に活用していく事を考えている。
|