• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

多様な読み手のための単語難易度指標指標の統計的構築手法の開発

Research Project

Project/Area Number 15K16059
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

江原 遥  国立研究開発法人産業技術総合研究所, 人工知能研究センター, 研究員 (60738029)

Project Period (FY) 2015-04-01 – 2018-03-31
Keywords単語難易度 / 単語親密度 / 回帰 / 項目反応理論 / 確率モデル / 機械学習 / 人工知能
Outline of Annual Research Achievements

本研究の目的は,「理系学生が学ぶべき英単語の列挙」や「難しい日本語の簡単な英語への翻訳」などの第二言語学習者支援のための単語難易度指標の統計的構築方法を開発することである.具体的には,専門分野の考慮や,言語間での単語難易度の比較を可能とする単語難易度モデルを構築する.
本年度の目標は,「読み手集合を特徴に分解する分解モデル(例えば,日本語を母語とする英語学習者を,英語学習者+日本語母語話者といった特徴に分解する)」と全モデルの統合である.
本年度は,この分解モデルに関する研究を行い,本年度末に行われた言語処理学会にて発表した.母語話者を対象にした調査ではあるものの,言語心理学分野では,読み手の単語に対する親密度や,単語が意味するものをどの程度の度合いで想像できるか,といった言語心理学的指標の大規模調査が行われており,言語資源なども整備されている.そこで,この研究では,これらの指標を専門分野ごとの特徴に分解し,各専門分野が指標の値の予測にどの程度貢献しているかを計測する手法を提案した.この手法は,用いるデータを母語話者を対象にしたデータから第二言語学習者を対象にしたデータに変更すれば,そのまま本研究課題に適用可能である.
全モデルの統合についても,「読み手が知っている単語を推定するモデル(単語推定モデル)」は,これまでの研究成果で得られているので,困難なく実現できるめどがついた.
また,既に前年度の論文採択時に業績に含めたので再度の記載は行わないが,本研究に関連する研究が,人工知能分野におけるトップ国際会議(査読付き)であるThe 25th International Joint Conference on Artificial Intelligence (IJCAI-16)に採択されており,本年度内に発表した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度は,当初からの目標であった,「読み手集合を特徴に分解する分解モデル(例えば,日本語を母語とする英語学習者を,英語学習者+日本語母語話者といった特徴に分解する)」を提案することができた.さらに,全モデルの統合にもめどがついたため,おおむね順調に進展していると言える.

Strategy for Future Research Activity

本年度作成した「読み手集合を特徴に分解する分解モデル(例えば,日本語を母語とする英語学習者を,英語学習者+日本語母語話者といった特徴に分解する)」について,継続して論文を査読付き国際会議に投稿する.
また,これまでに提案した全モデルを統合し,論文やシステムの形で公開することを目指す.

Causes of Carryover

本研究の内容で平成28年度後半に重要な実験結果が得られたことにより,平成29年度の査読付き国際会議や論文誌に論文を投稿するめどがたった.したがって,さらに追加実験を行い,論文執筆・投稿を行うことにより,補助事業の目的を精緻に達成するため,延長を行ったため.

Expenditure Plan for Carryover Budget

必要な参考図書・文献の購入,情報収集のための国内・国際会議の参加にかかる費用,追加実験のためのデータ取得,論文執筆や投稿にかかる英文校正や別刷代などの目的で主に使用する.

  • Research Products

    (3 results)

All 2017 2016 Other

All Presentation (2 results) Remarks (1 results)

  • [Presentation] 生コーパスからの単語難易度関連指標の予測2017

    • Author(s)
      江原 遥
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      筑波大学(茨城県つくば市)
    • Year and Date
      2017-03-15 – 2017-03-15
  • [Presentation] 単語分散表現と単語難易度2016

    • Author(s)
      江原 遥
    • Organizer
      NLP若手の会 第11回シンポジウム
    • Place of Presentation
      ホテルシーモア(和歌山県西牟婁郡白浜町)
    • Year and Date
      2016-08-28 – 2016-08-28
  • [Remarks] 語彙予測問題に関するまとめページ(研究代表者の個人ページ下に作成した)

    • URL

      http://yoehara.com/vocabulary-prediction/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi