2015 Fiscal Year Research-status Report
計算言語学的手法を利用した人間の単語認識における定量的法則の発見
Project/Area Number |
26540113
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
高村 大也 東京工業大学, 精密工学研究所, 准教授 (80361773)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 自然言語処理 |
Outline of Annual Research Achievements |
平成27年度は、被験者実験の実験計画を立てるなど、実際の実験の準備を行った。より具体的には、実験の実施場所、実施環境の決定、また実験内容の具体化などを行った。そのために、同様の実験を行っている既存研究を調査し、参考にした。同時に実験において考えられるリスクの洗い出しも行った。これらをもとに、倫理審査手続きを行った。倫理審査手続きに時間がかかってしまい、被験者実験の実施が次年度にずれ込むことになった。これに伴い、本研究の最終年度を平成28年度に延長した。また、実験結果の分析に用いる統計的指標として、文の容認度と呼ばれる指標が有効である可能性が出てきたので、この実装および、これを用いた予備的な実験を行った。これは、高精度な言語モデルによる文の生成確率の対数と、ユニグラム言語モデルによる文の生成確率の対数の差を、文長で正規化したものであり、正規確率が低い単語の影響を抑えることで、文としての自然さを測るものである。予備的な実験では、実際に不自然な文が容認度が低く、自然な文が容認度が高いかについての検証を行った。また、ニューラルネットワークに基づいた単語や文の分散表現の研究が急速に発展してきているので、単語の類似度の計算にこれらが利用できそうかについての調査を行った。単語の分散表現は、単語間の類似度を測る方法として優れていることがわかり、文字列カーネルなどに加えて、分散表現に基づいた類似度も、分析に用いる予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
被験者実験の実験計画などについては完成したものの、倫理審査手続きに時間がかかってしまい、被験者実験の実施が次年度にずれ込むことになったため、やや遅れていると判断した。
|
Strategy for Future Research Activity |
平成27年度に行う予定であった被験者実験を、倫理審査手続きが間に合わなかったために、平成28年度に行うことになった。よって、平成28年度は、まず被験者実験を実施し、その実験結果をまとめ、知見が得られたと判断できた場合は論文として研究結果を報告する予定である。
|
Causes of Carryover |
倫理審査手続きの遅れにより、被験者実験を平成27年度に実施することができず、これを平成28年度に実施することになった。これにより、被験者実験に必要な予算を平成28年度に使用することになった。
|
Expenditure Plan for Carryover Budget |
次年度使用額は、被験者実験の謝金として用いる予定である。
|