研究課題/領域番号 |
15K12097
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 含意関係認識 |
研究実績の概要 |
含意関係認識とは,あるテキストPとテキストHが与えられた時,テキストHがテキストPから自然に演繹できるか否かを判定するタスクであり,従来から広く検討されている課題である.ただし,多くの従来研究では,PとHとして同一言語で記述された単文を対象とする含意関係認識を研究している状況である.それに対して,本研究課題では,複数文からなるテキストPと,テキストPとは異なる言語で記述された単文Hの含意関係認識に取り組む. 当初研究計画では,日英対訳コーパスを用いて,英語で記述された単文Pと日本語で記述された単文Hの含意関係コーパスを自動構築することを計画していた.平成27年度の検討により,当初研究計画の方法では負例の収集に偏りが生じることが明らかとなった.平成28年度には,このような偏りがあるデータが含意関係認識器の学習に対して,どのような影響を与えるのか,偏りに影響されない学習が可能であるかを検討した.近年の自然言語処理研究においては,機械学習手法として,深層学習を利用することが主となっているため,特に深層学習を適用した場合の偏りの影響について検討した.検討した結果,偏りが深層学習に与える影響は,一般に予想されているよりも大きいこと,特に人間が偏りを認識できないような微細な偏りであっても学習結果に大きな影響を与えることを明らかにした. そのため,当初研究計画にはなかったが,日英単文間の偏りのない含意関係コーパスを人手構築した.ただし,本コーパスは人手構築したために,当初研究計画で予定していた日英対訳コーパスから自動構築したコーパスに比べて,かなり小規模である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初研究計画では,日英対訳コーパスを用いて,英語で記述された単文Pと日本語で記述された単文Hの含意関係認識器を学習するためのコーパスを作成することを計画していた.平成27年度の検討により,当初研究計画の方法では負例の収集に偏りが生じることが明らかとなった.平成28年度には,このような偏りがあるデータが含意関係認識器の学習に対して,どのような影響を与えるのか,偏りに影響されない学習が可能であるかを検討した.近年の自然言語処理研究においては,機械学習手法として,深層学習を利用することが主となっているため,特に深層学習を適用した場合の偏りの影響について検討した.検討した結果,偏りが深層学習に与える影響は,一般に予想されているよりも大きいこと,特に人間が偏りを認識できないような微細な偏りであっても学習結果に大きな影響を与えることを明らかにした. このように,当初研究計画では想定していなかった要因と,その要因に対する対応が発生しているものの,当初研究計画には含まれていなかった深層学習に対する検討を加えることによって,本研究課題の目的をより精緻に達成するための研究もあわせて実施中であり,全体としては概ね順調に進展していると言える.
|
今後の研究の推進方策 |
平成28年度までの研究により,含意関係コーパスに偏りがあると深層学習に大きな影響が生じることが明らかとなった.平成28年度に作成した小規模コーパスを利用して,この問題に対応する方法を検討する. また更に,複数文からなるテキストPと単文Hを対象とする含意関係認識タスクについての検討を進める.
|
次年度使用額が生じた理由 |
日英言語横断含意関係コーパスの作成方法について,研究の進展に応じた見直しを行い,最近の深層学習の知見を加えた検討を追加した.それに伴い,本研究課題から得られた研究成果の国際学会発表が当初期間内に行えなくなったため.
|
次年度使用額の使用計画 |
国際学会発表などに用いる.
|