• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

利用者からの要求を考慮したテキストデータからの知識抽出

Research Project

Project/Area Number 13131207
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionNara Institute of Science and Technology

Principal Investigator

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

Co-Investigator(Kenkyū-buntansha) 新保 仁  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90311589)
山田 寛康  北陸先端科学技術大学院大学, 情報科学研究科, 助手 (30345657)
Project Period (FY) 2001 – 2004
Project Status Completed (Fiscal Year 2004)
Budget Amount *help
¥23,300,000 (Direct Cost: ¥23,300,000)
Fiscal Year 2004: ¥4,900,000 (Direct Cost: ¥4,900,000)
Fiscal Year 2003: ¥6,000,000 (Direct Cost: ¥6,000,000)
Fiscal Year 2002: ¥5,600,000 (Direct Cost: ¥5,600,000)
Fiscal Year 2001: ¥6,800,000 (Direct Cost: ¥6,800,000)
Keywords文書構造解析 / テキストマイニング / 情報抽出 / 言語解析 / 機械学習 / 特徴抽出 / 未知語抽出 / 文書検索 / 固有表現抽出 / 知識抽出 / 文書解析 / 未知語の品詞推定 / 係り受け解析 / 用語の意味クラス分類 / サポートベクターマシ / 専門用語抽出 / サポートベクターマシン / 部分的言語解析 / 形態素解析 / 修正学習法
Research Abstract

肝炎検査項目に関する特徴記述の抽出:肝炎に関する論文概要の言語解析を行い,検査項目の記述に特徴的な表現の自動抽出実験を行なった.また,治療法あるいは治療薬の比較実験に関する論文概要から,比較対象,対象患者,効果に関する知識抽出に関する研究を行なった.前者については,検査項目を含む文の係り受け解析を行い,検査項目を主語または目的語に持つ述語表現をマイニングすることにより,検査項目の値や変化を表現する特徴表現の抽出を行なった.また,後者については,論文概要を対象に専門用語同定と意味クラス分類を行い,さらに各項目の知識抽出のためのパターンを記述することによって,どの程度の精度で知識抽出が可能かの確認のための実験を行なった.
文構造属性に基づく文分類:文書分類には文書に含まれる単語の集合を属性とした分類を行なうが,文の役割分類のように文によって記述されるより深い意味を分類するタスクには単なる単語集合では不充分である.文の意味分類を行なうためには構造をもった言語表現を属性として用いる必要があるが,どの表現が分類に有効な属性となるかを判定することは容易ではない.本研究では,係り受け解析によって木構造として表現された文集合から,それらを個別の役割に分類するのに有効な構造をグラフマイニング手法とブースティングアルゴリズムを用いることにより,効率的に列挙する方法を提案し,実験により有効に機能することを示した.
文書構造解析のための教師なしデータの利用:昨年度までに、論文概要の文を5つの役割に自動分類する方法について、手法の提案と実験を行なった。しかし、昨年度までの方法では,事前に役割分類を行なった訓練データを作成する必要があった.本年度は,人手分類による少量の訓練データと大量の生データを利用し,部分教師付き学習アルゴリズムの一つであるTransductive SVM法を用いることにより、分類済みのデータだけによる学習よりも分類精度を向上できることを示した.

Report

(4 results)
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • 2001 Annual Research Report
  • Research Products

    (24 results)

All 2004 Other

All Journal Article (6 results) Publications (18 results)

  • [Journal Article] 半構造化テキスト分類のためのブースティングアルゴリズム2004

    • Author(s)
      工藤 拓, 松本 裕治
    • Journal Title

      情報処理学会論文誌 45・9

      Pages: 2146-2156

    • Related Report
      2004 Annual Research Report
  • [Journal Article] カーネル法を用いた言語解析における高速化手法2004

    • Author(s)
      工藤 拓, 松本 裕治
    • Journal Title

      情報処理学会論文誌 45・9

      Pages: 2177-2185

    • NAID

      110002712265

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Use of morphological analysis in protein name recognition2004

    • Author(s)
      K.Yamamoto, T.Kudo, A.Konagaya, Y.Matsumoto
    • Journal Title

      Journal of Biomedical Informatics 37・6

      Pages: 471-482

    • Related Report
      2004 Annual Research Report
  • [Journal Article] A Boosting Algorithm for Classification of Semi-Structured Text2004

    • Author(s)
      Taku Kudo, Yuji Matsumoto
    • Journal Title

      Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing 10

      Pages: 301-308

    • NAID

      110003176988

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Finding cue expressions for knowledge extraction from scientific text2004

    • Author(s)
      Masashi Shimbo, Sayaka Tamamori, Yuji Matsumoto
    • Journal Title

      Proceedings of the 2004 Pacific Knowledge Acquisition Workshop

      Pages: 1-13

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Application of kernels to link analysis : first results2004

    • Author(s)
      Takahiko Ito, Masashi Shimbo, Yuji Matsumoto
    • Journal Title

      Proceedings of the Second Workshop on Mining Graphs, Trees and Sequences 2

      Pages: 13-24

    • Related Report
      2004 Annual Research Report
  • [Publications] Hiroyasu Yamada, Yuji Matsumoto: "Statistical dependency analysis with Support Vector Machines"Proceedings of the 8th International Workshop on Parsing Technologies. 8. 195-206 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Masashi Shimbo, Takahiro Yamazaki, Yuji Matsumoto: "Using sectioning information for text retrieval : a case study with the MEDLINE abstracts"Proceedings of the Second International Workshop on Active Mining. 2. 32-41 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Takahiro Yamazaki, Masashi Shimbo, Yuji Matsumoto: "A MEDLINE document search system using section information"人工知能学会研究会資料. SIG-KBS-A301. 25-30 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Taku Kudo, Yuji Matsumoto: "Fast methods for kernel based text analysis"Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics. 41. 24-31 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 玉森彩弥香, 新保仁, 松本裕治: "MEDLINEからの肝炎に関する知識抽出の試み"人工知能学会知識ベースシステム研究会. 64. 107-112 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Masayuki Asahara, Yuji Matsumoto: "Japanese named entity extraction with redundant morphological analysis"Proceeding of Human Language Technology and North American Chapter of Association for Computational Linguistics. 4. 8-15 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 松本裕治: "自然言語処理におけるシステム混合法の利用"電子情報通信学会論文誌D-II. J85-D-II・5. 709-716 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 工藤拓, 松本裕治: "チャンキングの段階適用による日本語係り受け解析"情報処理学会論文誌. 43・6. 1834-1842 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 工藤拓, 松本裕治: "Support Vector Machineを用いたChunk同定"自然言語処理. 9・5. 3-22 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Tetsuji Nakagawa, Taku Kudo, Yuji Matsumoto: "Revision Learning and its Application to Part-of-Speech Tagging"Proc. 40^<th> Annual Meeting of Association for Computational Linguistics. ACL02. 497-504 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Masahi Shimbo, Hiroyasu Yamada, Yuji Matsumoto: "Using Syntactic Dependency Information for Classification of Technical Terms"Proceedings of the 2002 Pacific Rim Knowledge Acquisition Workshop. PKAW02. 131-143 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 山田寛泰, 松本裕治: "Support Vector Machineを用いた決定性情報型構文解析"情報処理学会研究報告. 2002-NL-149. 57-64 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 山田寛康, 工藤拓, 松本裕治: "Support Vector Machineを用いた日本語固有表現抽出"情報処理学会論文誌. 43・1. 44-53 (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] Hiroya Takamura, Yuji Matsumoto: "Feature Space Restructuring for SVMs with Application to Text Categorization"Proceedings of 2001 Conference on Empirical Methods in Natural Language Processing. 6. 51-57 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] Taku Kudo, Yuji Matsumoto: "Chunking with Support Vector Machines"Proceedings of the Second Meeting of North American Chapter of Association for Computational Linguistics. 2. 192-199 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 松本裕治, 山田寛康, 新保仁: "学習に基づく専門用語分類"人工知能学会,人工知能基礎論研究会,知識ベースシステム研究会合同研究会. SIG-FAI/K BS-J-13. 79-84 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 中川哲治, 工藤拓, 松本裕治: "修正学習法による形態素解析"情報処理学会研究報告. NL-146. 1-8 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 工藤拓, 山本薫, 坪井祐太, 松本裕治: "言語情報を利用したテキストマイニング"情報処理学会研究報告. NL-148. 65-72 (2002)

    • Related Report
      2001 Annual Research Report

URL: 

Published: 2001-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi