• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

逆系列アラインメント問題の条件付確率場による解法と情報抽出への適用

研究課題

研究課題/領域番号 18700148
研究機関奈良先端科学技術大学院大学

研究代表者

新保 仁  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90311589)

キーワード並列句 / 情報抽出 / アラインメント
研究概要

本年度の成果は以下のとおり.
1.系列アラインメントに基づく並列句同定の基礎技術を開発した.類似の方法で並列句同定を行う手法はすでに存在するが,既存の手法がパラメターを人手で調整する必要があったのに対し,われわれが開発した手法は,学習機能を有しており,パラメータ調整が自動で行える,という大きな違いがある.このため既存法では不可能であった,多数のパラメターを導入することが可能になる.学習にはパーセプトロンを系列アラインメント学習用に拡張し用いた.この手法は条件付確率場の近似とみなせ,実装が比較的容易という特徴がある.
2.開発した手法を実装し,この実装を用いて予備実験を行った.既存の英語医学生物学コーパスを対象にその精度を測定した.結果として,必要最低限の素性のみを用いたにもかかわらず,句構造文法パーザおよび系列チャンキングによる手法を上回る精度を得た.
3.並列句コーパスを作成するための2種類のタグ付けシステムを作成した.これらを用いて訓練データを作成することで,学習に用いるデータ量を効率的に増やすことが可能となる.
4.また,次年度以降,コーパス中の単語共起頻度を素性として用いることを計画しているが,そのための基礎技術としてリンク解析の研究を行った.特に,機械学習分野で注目されているカーネル法をリンク解析に適用する際の問題点について調査を行った.特に,複数のトピック(コミュニティ)が存在するグラフにおける,ノイマンカーネルの問題点を指摘し,そのための解決法を提案した.次年度にはこの知見を生かして,医学生物学コーパス中の単語のネットワークを作成し,開発したリンク解析技術を適用して得られた情報を並列句同定の際の素性として用いる予定である.

  • 研究成果

    (6件)

すべて 2007 2006

すべて 雑誌論文 (5件) 図書 (1件)

  • [雑誌論文] コミュニティを考慮したカーネル引用解析2007

    • 著者名/発表者名
      伊藤, 新保, 持橋, 松本
    • 雑誌名

      電子情報通信学会論文誌 D Vol.J90-D No.2

      ページ: 233-244

  • [雑誌論文] カーネルリンク解析におけるパラメタ依存性と近似計算について2006

    • 著者名/発表者名
      新保, 伊藤, 松本
    • 雑誌名

      日本データベース学会Letters Vol. 5 No. 2

      ページ: 101-104

  • [雑誌論文] 部分アラインメント同定を応用した並列句解析2006

    • 著者名/発表者名
      原, 新保, 松本
    • 雑誌名

      Proceedings of the International Workshop on Data-Mining and Statistical Science

      ページ: 167-172

  • [雑誌論文] Exploring Multiple Communities with Kernel-Based Link Analysis2006

    • 著者名/発表者名
      T.Ito, M.Shimbo, D.Mochihashi, Y.Matsumoto
    • 雑誌名

      Proceedings of the 10th European Conference on Principles and Practice of Knowledge Discovery in Databases (PKDD) LNAI 4213

      ページ: 235-246

  • [雑誌論文] Investigating the effect of multiple communities on kernel-based citation analysis2006

    • 著者名/発表者名
      T.Ito, M.Shimbo, D.Mochihashi, Y.Matsumoto
    • 雑誌名

      Proceedings of the Second International Special Workshop on Databases for Next-Generation Researchers (SWOD 2006)

  • [図書] Mining Graph Data, Chapter 12 Kernels as Link Analysis Measures (pp. 283-310) (D. Cook and L. Holder (eds.))2006

    • 著者名/発表者名
      M.Shimbo, T.Ito
    • 総ページ数
      28
    • 出版者
      John Wiley & Sons

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi