• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

訓練事例の最適化による語義曖昧性における領域適応

研究課題

研究課題/領域番号 24700138
研究機関東京農工大学

研究代表者

古宮 嘉那子  東京農工大学, 工学(系)研究科(研究院), 助教 (10592339)

キーワード人工知能 / 自然言語処理 / 語義曖昧性解消 / 領域適応 / 最適化 / 調整
研究概要

日本語書き言葉均衡コーパス(以下BCCWJ)のうち、6ジャンルのコアデータ(人手で形態素解析を行ったデータ)について語義タグ付きデータが得られたため、これまで使っていた、BCCWJの非コアデータ(ツールで形態素解析を行ったデータ)と、RWCコーパスのデータと合わせて新たにより大きなベクトル集合を作成した。新たに得られたジャンルは、BCCWJのYahoo!知恵袋、白書、Yahoo!ブログ、書籍、雑誌、新聞であり、これまで利用していたのはBCCWJのYahoo!知恵袋、白書、またRWCの新聞のコーパスである。このとき、これまでは小分類による語義に分類していたが、より大きな意味の塊である、中分類に語義を分類する実験を行えるように改めた。
また、このとき、すべてのジャンルで使っている単語がひとつもなかったため、入手可能なコーパスのうち、3種類のデータを選択し、それらに共通している単語について実験を行う方式とした。また、この3種類のデータの選択は、9ジャンルから同ジャンルの重複を除いた全通り試した。
新しく作成したベクトルデータを使って、これまで提案していた確信度、LOOを利用したスコアの実験を行った。さらに確信度の調整の実験を行い、語義数によって確信度を割ることによって適切な調整ができることを示した。
また、SVRを利用した手法について試してみたが、思ったような結果は得られなかった。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

データが新たに追加されたことにより、新しく実験用にデータを作り直した。その時間を当初は全く想定していなかったため、遅れが発生している。また、前回のデータと変更した部分についての検証も行った。こちらも想定外であるため、遅れの要因となっている。

今後の研究の推進方策

一番初めには、データを評価するのに最も良い尺度を利用して線形計画法を利用しようとしていたが、線形計画法は昨年度に不適切と判断して、山登り法を用いた手法に変更している。今回は、この際に利用するデータを評価するための尺度(確信度)を調整した。
来年度は調整した確信度を利用して、昨年の成果のひとつである、山登り法を用いた手法による応用を考えている。ただし、前よりは汎用的な尺度が得られたものの、山登り法に適している尺度かどうかは、実際に実験を行ってみないと分からないため、適宜確かめつつ実験を進めるつもりである。
この際、実験データ増加により、実行時間も増えることが予想されるため、ランダムにサンプリングして行えるような実験を行うことで対応する予定である。また、山登り法の際に、確信度を利用する方法だけでなく、サポートベクターマシーンの特色(サポートベクター数の変化)を生かした山登り法を用いた手法による応用を試すつもりである。こちらも同様にランダムサンプリングして行うことで、実行時間を抑えようと考えている。また、学生の卒業論文との関係を考えて進めるつもりであるため、何らかの結果を今年度中に得ることができると考えている。

次年度の研究費の使用計画

2013年度中に国際会議に行く予定であったが、選考に落ちてしまい、書き直して提出したところ、発表予定が2014年4月に延びたため。
2014年4月に出張することで使用する予定である。

  • 研究成果

    (10件)

すべて 2014 2013

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (8件)

  • [雑誌論文] Question Answering System Using Q & A Site Corpus -Query Expansion and Answer Candidate Evaluation2013

    • 著者名/発表者名
      Kanako Komiya, Yuji Abe, Hajime Morita and Yoshiyuki Kotani
    • 雑誌名

      Springerplus 2013

      巻: 2:396 ページ: 1-11

    • DOI

      10.1186/2193-1801-2-396

    • 査読あり
  • [雑誌論文] New Naive Bayes Methods using Data from All Classes2013

    • 著者名/発表者名
      Kanako Komiya, Yusuke Ito and Yoshiyuki Kotani
    • 雑誌名

      International Journal of Advanced Intelligence

      巻: 5 ページ: 印刷中

    • 査読あり
  • [学会発表] 合議による語義曖昧性解消の領域適応のための確信度の調整2014

    • 著者名/発表者名
      古宮嘉那子, 小谷善行, 奥村学
    • 学会等名
      第二十回言語処理学会
    • 発表場所
      北海道大学、札幌
    • 年月日
      20140317-20140320
  • [学会発表] CRFによるWebコーパスからのアニメタイトルに対する訳語の自動抽出2014

    • 著者名/発表者名
      山崎舞子, 森田一, 古宮嘉那子, 小谷善行
    • 学会等名
      第二十回言語処理学会
    • 発表場所
      北海道大学、札幌
    • 年月日
      20140317-20140320
  • [学会発表] コンピュータ将棋におけるSVMを用いたMove Orderingの効率化2014

    • 著者名/発表者名
      野口 拓央,古宮 嘉那子,並木 美太郎,小谷 善行
    • 学会等名
      第31回 ゲーム情報学研究会
    • 発表場所
      東京工科大学、八王子
    • 年月日
      20140317-20140317
  • [学会発表] SVRを用いた麻雀における捨て牌の危険度の推定2014

    • 著者名/発表者名
      我妻 敦,原田 将旗,森田 一,古宮 嘉那子,小谷 善行
    • 学会等名
      第31回 ゲーム情報学研究会
    • 発表場所
      東京工科大学、八王子
    • 年月日
      20140317-20140317
  • [学会発表] 麻雀における手牌と残り牌からの上がり探索による着手決定アルゴリズムCHE2014

    • 著者名/発表者名
      原田 将旗,古宮 嘉那子,小谷 善行
    • 学会等名
      第31回 ゲーム情報学研究会
    • 発表場所
      東京工科大学、八王子
    • 年月日
      20140317-20140317
  • [学会発表] トピックモデルと概念辞書による日本語の語義曖昧性解消2014

    • 著者名/発表者名
      佐々木 悠人,古宮 嘉那子,小谷 善行
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所、立川
    • 年月日
      20140306-20140307
  • [学会発表] SVMを用いたインドネシア語連体従属接続詞の判定システム2014

    • 著者名/発表者名
      Wahyu Purnomo,古宮 嘉那子,小谷 善行
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所、立川
    • 年月日
      20140306-20140307
  • [学会発表] Query Expansion using Mutual Information between Words in Question and Its Answer2013

    • 著者名/発表者名
      Kanako Komiya, Yuji Abe, Yoshiyuki Kotani
    • 学会等名
      35th International Conference on Information Technology Interfaces
    • 発表場所
      ドブロブニク、クロアチア
    • 年月日
      20130624-20130627

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi