2016 Fiscal Year Research-status Report
連想インタラクションに基づく日本語語彙学習システムの開発
Project/Area Number |
15K16787
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
寺岡 丈博 東京工科大学, メディア学部, 助教 (30617329)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 換喩解析 / 連想 / 共起 / 動詞 / 連想実験 |
Outline of Annual Research Achievements |
平成28年度は,昨年度に構築した換喩解析システムの精度を向上させるとともに,連想情報と共起情報の差異性について分析を行った.また,並行して大規模な連想実験を実施し,動詞連想概念辞書の拡張に必要なデータをほぼ全て取得した. 換喩解析に関しては,連想による単語間の概念間距離を2種類に増やして利用することで換喩表現の検出精度を向上させ,換喩表現の解釈も含めた換喩解析全体の精度向上を実現した.そして,単語の共起情報を用いた従来手法と比較することで,換喩解析における連想と共起の特長を明らかにした. 連想と共起の差異性については,動詞連想概念辞書と新聞コーパスを用いて動詞における連想しやすい語と共起しやすい語について比較分析を行った.また連想実験データと新聞コーパスからそれぞれ作成した単語の分散表現を比較し,動詞に対して類似度が高い語の関係性が連想と共起とでは異なることを示した.これらの結果より,本研究で開発を目指す連想に基づいた日本語語彙学習システムが,従来の日本語学習に関する辞書・コーパスや学習システムとは,特長や性質が異なったものになることが示唆される. 上記と並行して,昨年度に抽出した動詞連想概念辞書で不足している日本語学習用に必要な動詞約300語に関して連想実験を実施した.実験参加者は延べ約700人であり,いずれも20代の大学生・大学院生が対象となっている.これにより,動詞連想概念辞書の拡張を目的とした実験データ収集はほぼ完了したため,今後は連想語の表記ゆれの修正などのデータ整理に取り組む予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,連想と共起に関して性質と応用における比較分析を行うとともに連想実験のデータ収集を完了した.前者では,動詞に対して連想しやすい語と共起しやすい語の共通性と差異性を確認し,かつ換喩解析という応用における各特長を明らかにした.また,後者の連想実験に関しては交付申請書の記載内容よりも早いペースでデータ収集を完了することができた.ゆえに,現在までの進捗はおおむね順調に進展していると考える.
|
Strategy for Future Research Activity |
今後の研究としては,これまでの連想と共起の差異性と特長を考慮した語彙学習システムの方針を検討した上でシステムの開発を目指す.同時に,システムに必要な動詞連想概念辞書のデータ整理に取り組み,辞書の完成を目指す.
|
Causes of Carryover |
年度末まで連想実験を実施していたため,実験参加者へ支払う謝金の合計額を算出することができず,購入を予定していた開発用機器を選ぶことができなかったため.
|
Expenditure Plan for Carryover Budget |
動詞連想概念辞書のデータ整理とシステム開発補助の謝金として計25万円を使用する予定である.その他,年度末の学会発表(言語処理学会,情報処理学会)の旅費・参加費として約10万円を使用する.また,平成28年度に購入できなかった開発用機器を残りの予算額に応じて購入する予定である.
|
Research Products
(6 results)