• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

訓練事例の最適化による語義曖昧性における領域適応

Research Project

Project/Area Number 24700138
Research InstitutionTokyo University of Agriculture and Technology

Principal Investigator

古宮 嘉那子  東京農工大学, 工学(系)研究科(研究院), 助教 (10592339)

Keywords人工知能 / 自然言語処理 / 語義曖昧性解消 / 領域適応 / 最適化 / 調整
Research Abstract

日本語書き言葉均衡コーパス(以下BCCWJ)のうち、6ジャンルのコアデータ(人手で形態素解析を行ったデータ)について語義タグ付きデータが得られたため、これまで使っていた、BCCWJの非コアデータ(ツールで形態素解析を行ったデータ)と、RWCコーパスのデータと合わせて新たにより大きなベクトル集合を作成した。新たに得られたジャンルは、BCCWJのYahoo!知恵袋、白書、Yahoo!ブログ、書籍、雑誌、新聞であり、これまで利用していたのはBCCWJのYahoo!知恵袋、白書、またRWCの新聞のコーパスである。このとき、これまでは小分類による語義に分類していたが、より大きな意味の塊である、中分類に語義を分類する実験を行えるように改めた。
また、このとき、すべてのジャンルで使っている単語がひとつもなかったため、入手可能なコーパスのうち、3種類のデータを選択し、それらに共通している単語について実験を行う方式とした。また、この3種類のデータの選択は、9ジャンルから同ジャンルの重複を除いた全通り試した。
新しく作成したベクトルデータを使って、これまで提案していた確信度、LOOを利用したスコアの実験を行った。さらに確信度の調整の実験を行い、語義数によって確信度を割ることによって適切な調整ができることを示した。
また、SVRを利用した手法について試してみたが、思ったような結果は得られなかった。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

データが新たに追加されたことにより、新しく実験用にデータを作り直した。その時間を当初は全く想定していなかったため、遅れが発生している。また、前回のデータと変更した部分についての検証も行った。こちらも想定外であるため、遅れの要因となっている。

Strategy for Future Research Activity

一番初めには、データを評価するのに最も良い尺度を利用して線形計画法を利用しようとしていたが、線形計画法は昨年度に不適切と判断して、山登り法を用いた手法に変更している。今回は、この際に利用するデータを評価するための尺度(確信度)を調整した。
来年度は調整した確信度を利用して、昨年の成果のひとつである、山登り法を用いた手法による応用を考えている。ただし、前よりは汎用的な尺度が得られたものの、山登り法に適している尺度かどうかは、実際に実験を行ってみないと分からないため、適宜確かめつつ実験を進めるつもりである。
この際、実験データ増加により、実行時間も増えることが予想されるため、ランダムにサンプリングして行えるような実験を行うことで対応する予定である。また、山登り法の際に、確信度を利用する方法だけでなく、サポートベクターマシーンの特色(サポートベクター数の変化)を生かした山登り法を用いた手法による応用を試すつもりである。こちらも同様にランダムサンプリングして行うことで、実行時間を抑えようと考えている。また、学生の卒業論文との関係を考えて進めるつもりであるため、何らかの結果を今年度中に得ることができると考えている。

Expenditure Plans for the Next FY Research Funding

2013年度中に国際会議に行く予定であったが、選考に落ちてしまい、書き直して提出したところ、発表予定が2014年4月に延びたため。
2014年4月に出張することで使用する予定である。

  • Research Products

    (10 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (8 results)

  • [Journal Article] Question Answering System Using Q & A Site Corpus -Query Expansion and Answer Candidate Evaluation2013

    • Author(s)
      Kanako Komiya, Yuji Abe, Hajime Morita and Yoshiyuki Kotani
    • Journal Title

      Springerplus 2013

      Volume: 2:396 Pages: 1-11

    • DOI

      10.1186/2193-1801-2-396

    • Peer Reviewed
  • [Journal Article] New Naive Bayes Methods using Data from All Classes2013

    • Author(s)
      Kanako Komiya, Yusuke Ito and Yoshiyuki Kotani
    • Journal Title

      International Journal of Advanced Intelligence

      Volume: 5 Pages: 印刷中

    • Peer Reviewed
  • [Presentation] 合議による語義曖昧性解消の領域適応のための確信度の調整2014

    • Author(s)
      古宮嘉那子, 小谷善行, 奥村学
    • Organizer
      第二十回言語処理学会
    • Place of Presentation
      北海道大学、札幌
    • Year and Date
      20140317-20140320
  • [Presentation] CRFによるWebコーパスからのアニメタイトルに対する訳語の自動抽出2014

    • Author(s)
      山崎舞子, 森田一, 古宮嘉那子, 小谷善行
    • Organizer
      第二十回言語処理学会
    • Place of Presentation
      北海道大学、札幌
    • Year and Date
      20140317-20140320
  • [Presentation] コンピュータ将棋におけるSVMを用いたMove Orderingの効率化2014

    • Author(s)
      野口 拓央,古宮 嘉那子,並木 美太郎,小谷 善行
    • Organizer
      第31回 ゲーム情報学研究会
    • Place of Presentation
      東京工科大学、八王子
    • Year and Date
      20140317-20140317
  • [Presentation] SVRを用いた麻雀における捨て牌の危険度の推定2014

    • Author(s)
      我妻 敦,原田 将旗,森田 一,古宮 嘉那子,小谷 善行
    • Organizer
      第31回 ゲーム情報学研究会
    • Place of Presentation
      東京工科大学、八王子
    • Year and Date
      20140317-20140317
  • [Presentation] 麻雀における手牌と残り牌からの上がり探索による着手決定アルゴリズムCHE2014

    • Author(s)
      原田 将旗,古宮 嘉那子,小谷 善行
    • Organizer
      第31回 ゲーム情報学研究会
    • Place of Presentation
      東京工科大学、八王子
    • Year and Date
      20140317-20140317
  • [Presentation] トピックモデルと概念辞書による日本語の語義曖昧性解消2014

    • Author(s)
      佐々木 悠人,古宮 嘉那子,小谷 善行
    • Organizer
      第5回コーパス日本語学ワークショップ
    • Place of Presentation
      国立国語研究所、立川
    • Year and Date
      20140306-20140307
  • [Presentation] SVMを用いたインドネシア語連体従属接続詞の判定システム2014

    • Author(s)
      Wahyu Purnomo,古宮 嘉那子,小谷 善行
    • Organizer
      第5回コーパス日本語学ワークショップ
    • Place of Presentation
      国立国語研究所、立川
    • Year and Date
      20140306-20140307
  • [Presentation] Query Expansion using Mutual Information between Words in Question and Its Answer2013

    • Author(s)
      Kanako Komiya, Yuji Abe, Yoshiyuki Kotani
    • Organizer
      35th International Conference on Information Technology Interfaces
    • Place of Presentation
      ドブロブニク、クロアチア
    • Year and Date
      20130624-20130627

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi