2014 Fiscal Year Research-status Report
Project/Area Number |
24700138
|
Research Institution | Ibaraki University |
Principal Investigator |
古宮 嘉那子 茨城大学, 工学部, 講師 (10592339)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 自然言語処理 |
Outline of Annual Research Achievements |
研究を始めた当初の予定からは多少の変更はあったものの,実験まではおおむね順調に進んでいる. 具体的には,平成25~26年度の時点で,確信度とLOO-boundを利用した適切な訓練事例の選択を行い,この手法が訓練事例の選択に有用であることが分かっている.その手法についても,訓練事例ごとに用例を選択する方法と,単語タイプごとに訓練事例を選択する手法を提案しており,それぞれに成果が出ている.しかし,これらの結果は,平成26年度に新たな語義タグつきコーパスであるBCCWJの拡張コーパスがリリースされ,その後,新コーパスを含めたコーパスで続きの実験を行ったこと,また,新コーパス上で新しい手法で実験し,より良い結果が出た場合には,ひとつの結果としてまとめて論文にするつもりだったため,研究会の論文にはまとめたものの,まだ国際会議の論文にしていない. また,27年度は,すべての語義を利用することによって,LOO-boundの補正の必要をなくして実験をしなおした.指標はふたつよりもひとつの方がシンプルになるので,同程度の精度が出せるのであれば,補正の必要はないほうが望ましいためである.この手法については,有望な結果が出ているが,初期事例数が少なすぎて,高い精度が出せなかった. また,これに伴い,サポートベクトルの継承を行って訓練事例数を反復的に増やしていく手法を提案し実験を行ったが,こちらも初期事例数が少なすぎて,高い精度が出せなかった.そのため,サポートベクトルの継承はいったん諦め,初期事例数を増やして確信度だけで実験を行ったところ,精度は改善したが,全用例を利用した精度にはわずかにおよばなかった.しかしまだ用例数がとても少ないため,事例数をもう少し増やせば逆転する可能性がある. また,これとは別に,周辺的な知見を論文にして投稿および発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
平成26年度は周辺的な知見を国際会議に投稿したものの,通すことができなかった.そのため,現在投稿予定の論文が三報ある.具体的には,(1)周辺的な知見である「固有名詞抽出における領域適応」の論文が一報,(2)本質的な知見のうち,あたためてあった「単語ごとに適切な訓練事例を確信度とLOO-boundを利用して選択する手法(語義曖昧性解消の領域適応についての論文)」が一報,(3)本質的な知見のうち,さらにいい結果を出そうとしている「用例ごとに適切な訓練事例を確信度だけを利用して選択する手法(語義曖昧性解消の領域適応についての論文)」が一報である. (1)は英語で書き終わっており,国際会議に投稿を行える状態である.(2)は日本語の研究会の論文になっており,英語に書き直せば国際会議に投稿を行える状態である.(3)は初期事例数等を変えて実験を行っている最中である. 平成27度においてこれらの三報を投稿・発表する予定である.
|
Strategy for Future Research Activity |
国際会議に積極的に投稿を行い,研究成果を国内外に発表する予定である. 上記の論文(1)~(3)について,(1)に関しては表現を見直した後,前回の会議のコメントに対応して書き改め,論文を投稿する予定である.(2)については日本語の研究会の内容を英語にして国際会議に投稿する予定である.(3)に関しては,実験がうまくいけば最新の内容で論文をまとめて投稿するつもりである.(3)について,もしも実験がそれほどうまくいかない場合には,設定を変えればさらに良い結果になる可能性は十分にあるが,科学研究費の最終年度であるため,結果によっては一度実験を区切って,平成25年の実験結果を投稿する予定である.その場合には,「用例ごとに適切な訓練事例を確信度を利用して選択する手法」が小さめのコーパスにおいての実験で有用だったという結果の発表となる.
|
Causes of Carryover |
授業の準備等の観点から平成26年度中の過度の出張は断念したため.
|
Expenditure Plan for Carryover Budget |
平成27度の国際会議(RANLP 2015,EMNLP 2015,PACLIC 2015など)に積極的に投稿し,アクセプトとされた場合には発表を行う予定である.そのため,科学研究費は,渡航費および国際会議の登録料として利用する予定である.ただし,残りの科学研究費で三度渡航するのは不可能であるため,平成27年度中に複数アクセプトされた場合には,そのうちのひとつないし二つの渡航費・および国際会議の登録料に当てるつもりである.
|