• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

訓練事例の最適化による語義曖昧性における領域適応

Research Project

Project/Area Number 24700138
Research InstitutionIbaraki University

Principal Investigator

古宮 嘉那子  茨城大学, 工学部, 講師 (10592339)

Project Period (FY) 2012-04-01 – 2016-03-31
Keywords自然言語処理
Outline of Annual Research Achievements

研究を始めた当初の予定からは多少の変更はあったものの,実験まではおおむね順調に進んでいる.
具体的には,平成25~26年度の時点で,確信度とLOO-boundを利用した適切な訓練事例の選択を行い,この手法が訓練事例の選択に有用であることが分かっている.その手法についても,訓練事例ごとに用例を選択する方法と,単語タイプごとに訓練事例を選択する手法を提案しており,それぞれに成果が出ている.しかし,これらの結果は,平成26年度に新たな語義タグつきコーパスであるBCCWJの拡張コーパスがリリースされ,その後,新コーパスを含めたコーパスで続きの実験を行ったこと,また,新コーパス上で新しい手法で実験し,より良い結果が出た場合には,ひとつの結果としてまとめて論文にするつもりだったため,研究会の論文にはまとめたものの,まだ国際会議の論文にしていない.
また,27年度は,すべての語義を利用することによって,LOO-boundの補正の必要をなくして実験をしなおした.指標はふたつよりもひとつの方がシンプルになるので,同程度の精度が出せるのであれば,補正の必要はないほうが望ましいためである.この手法については,有望な結果が出ているが,初期事例数が少なすぎて,高い精度が出せなかった.
また,これに伴い,サポートベクトルの継承を行って訓練事例数を反復的に増やしていく手法を提案し実験を行ったが,こちらも初期事例数が少なすぎて,高い精度が出せなかった.そのため,サポートベクトルの継承はいったん諦め,初期事例数を増やして確信度だけで実験を行ったところ,精度は改善したが,全用例を利用した精度にはわずかにおよばなかった.しかしまだ用例数がとても少ないため,事例数をもう少し増やせば逆転する可能性がある.
また,これとは別に,周辺的な知見を論文にして投稿および発表を行った.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

平成26年度は周辺的な知見を国際会議に投稿したものの,通すことができなかった.そのため,現在投稿予定の論文が三報ある.具体的には,(1)周辺的な知見である「固有名詞抽出における領域適応」の論文が一報,(2)本質的な知見のうち,あたためてあった「単語ごとに適切な訓練事例を確信度とLOO-boundを利用して選択する手法(語義曖昧性解消の領域適応についての論文)」が一報,(3)本質的な知見のうち,さらにいい結果を出そうとしている「用例ごとに適切な訓練事例を確信度だけを利用して選択する手法(語義曖昧性解消の領域適応についての論文)」が一報である.
(1)は英語で書き終わっており,国際会議に投稿を行える状態である.(2)は日本語の研究会の論文になっており,英語に書き直せば国際会議に投稿を行える状態である.(3)は初期事例数等を変えて実験を行っている最中である.
平成27度においてこれらの三報を投稿・発表する予定である.

Strategy for Future Research Activity

国際会議に積極的に投稿を行い,研究成果を国内外に発表する予定である.
上記の論文(1)~(3)について,(1)に関しては表現を見直した後,前回の会議のコメントに対応して書き改め,論文を投稿する予定である.(2)については日本語の研究会の内容を英語にして国際会議に投稿する予定である.(3)に関しては,実験がうまくいけば最新の内容で論文をまとめて投稿するつもりである.(3)について,もしも実験がそれほどうまくいかない場合には,設定を変えればさらに良い結果になる可能性は十分にあるが,科学研究費の最終年度であるため,結果によっては一度実験を区切って,平成25年の実験結果を投稿する予定である.その場合には,「用例ごとに適切な訓練事例を確信度を利用して選択する手法」が小さめのコーパスにおいての実験で有用だったという結果の発表となる.

Causes of Carryover

授業の準備等の観点から平成26年度中の過度の出張は断念したため.

Expenditure Plan for Carryover Budget

平成27度の国際会議(RANLP 2015,EMNLP 2015,PACLIC 2015など)に積極的に投稿し,アクセプトとされた場合には発表を行う予定である.そのため,科学研究費は,渡航費および国際会議の登録料として利用する予定である.ただし,残りの科学研究費で三度渡航するのは不可能であるため,平成27年度中に複数アクセプトされた場合には,そのうちのひとつないし二つの渡航費・および国際会議の登録料に当てるつもりである.

  • Research Products

    (9 results)

All 2015 2014 Other

All Presentation (8 results) Remarks (1 results)

  • [Presentation] Error Analysis of Named Entity Recognition in BCCWJ2015

    • Author(s)
      Masaaki ICHIHARA, Kanako KOMIYA, Tomoya IWAKURA, Maiko YAMAZAKI
    • Organizer
      第二十一回言語処理学会年次大会 エラー分析ワークショップ
    • Place of Presentation
      京都大学 吉田キャンパス
    • Year and Date
      2015-03-20 – 2015-03-21
  • [Presentation] BCCWJにおける固有表現抽出のエラー分析2015

    • Author(s)
      市原 正陽, 山崎 舞子, 古宮 嘉那子
    • Organizer
      第七回コーパス日本語学ワークショップ予稿集
    • Place of Presentation
      立川(国立国語研究所)
    • Year and Date
      2015-03-10 – 2015-03-11
  • [Presentation] 商品カテゴリの階層構造を用いた商品分類2015

    • Author(s)
      中島 道幸, 古宮 嘉那子
    • Organizer
      第七回コーパス日本語学ワークショップ予稿集
    • Place of Presentation
      立川(国立国語研究所)
    • Year and Date
      2015-03-10 – 2015-03-11
  • [Presentation] 領域適応のためのサポートベクトルを用いた訓練事例の反復的選択2015

    • Author(s)
      小林 優稀, 古宮 嘉那子, 佐々木 稔, 新納 浩幸, 奥村 学
    • Organizer
      第七回コーパス日本語学ワークショップ予稿集
    • Place of Presentation
      立川(国立国語研究所)
    • Year and Date
      2015-03-10 – 2015-03-11
  • [Presentation] Automatic Extraction of the Translation of Anime Titles from Web Corpora Using CRF2014

    • Author(s)
      Maiko YAMAZAKI, Hajime MORITA, Kanako KOMIYA, Yoshiyuki KOTANI
    • Organizer
      JCKBSE 2014
    • Place of Presentation
      慶応大学日吉キャンパス
    • Year and Date
      2014-09-18 – 2014-09-20
  • [Presentation] 周辺語義モデルによる日本語の教師無し語義曖昧性解消2014

    • Author(s)
      佐々木 悠人, 古宮嘉那子, 森田一, 小谷善行
    • Organizer
      情報処理学会 自然言語処理研究会
    • Place of Presentation
      首都大学東京 南大沢キャンパス
    • Year and Date
      2014-09-01 – 2014-09-02
  • [Presentation] Word Sense Disambiguation Based on Semi-automatically Constructed Collocation Dictionary,2014

    • Author(s)
      Minoru SASAKI, Kanako KOMIYA, Hiroyuki SHINNNOU
    • Organizer
      SEMAPRO 2014
    • Place of Presentation
      イタリア ローマ
    • Year and Date
      2014-08-24 – 2014-08-28
  • [Presentation] Cross-lingual Product Recommendation Using Collaborative Filtering With Translation Pairs, Cicling20142014

    • Author(s)
      Kanako KOMIYA, Shohei SHIBATA, Yoshiyuki KOTANI
    • Organizer
      Cicling2014
    • Place of Presentation
      ネパール カトマンドゥー
    • Year and Date
      2014-04-06 – 2014-04-11
  • [Remarks] 古宮研究室のページ

    • URL

      http://komiya.cis.ibaraki.ac.jp/main.html

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi