• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

テキスト中の数値表現からの知識発見に関する研究

研究課題

研究課題/領域番号 22700137
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関東京大学

研究代表者

吉田 稔  東京大学, 情報基盤センター, 助教 (40361688)

研究期間 (年度) 2010 – 2011
研究課題ステータス 完了 (2011年度)
配分額 *注記
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2011年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2010年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード自然言語処理 / 数値情報 / テキストマイニング / 接尾辞配列 / クラスタリング / 数値検索 / ディリクレ過程混合モデル
研究概要

テキスト中の数値表現を適切に取り扱い,数値と言語の統合的なマイニングを行うための基盤技術の研究を行った.具体的な方針として,テキストを接尾辞配列により索引付けし,そこで数字列に対し,数値としての検索が行えるように拡張を行った.このシステムを,大規模なテキストに適用できるよう高速化し,これにより,文字列と数値の関係を対話的に取得できる基盤を構築できた.また,応用先として,数値を多く含む業務レポート等に対するテキストマイニングの研究を行った.

報告書

(3件)
  • 2011 実績報告書   研究成果報告書 ( PDF )
  • 2010 実績報告書
  • 研究成果

    (20件)

すべて 2012 2011 2010

すべて 雑誌論文 (6件) (うち査読あり 4件) 学会発表 (12件) 図書 (2件)

  • [雑誌論文] 二段階クラスタリングを単語重み付与に応用した人名曖昧性解消2010

    • 著者名/発表者名
      吉田稔、池田雅紀、小野真吾、佐藤一誠、中川裕志
    • 雑誌名

      日本データベース学会論文誌

      巻: Vol.9, No.2 ページ: 19-24

    • NAID

      40017420150

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] テキストマイニングの活用2010

    • 著者名/発表者名
      吉田稔, 中川裕志
    • 雑誌名

      情報の科学と技術

      巻: 60巻6号 ページ: 230-235

    • 関連する報告書
      2011 研究成果報告書
  • [雑誌論文] Person Name Disambiguation by Bootstrapping2010

    • 著者名/発表者名
      Minoru Yoshida, Masaki Ikeda, Shingo Ono, Issei Sato, and Hiroshi Nakagawa
    • 雑誌名

      Proceedings of SIGIR-2010

      ページ: 10-17

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] Mining Numbers in Text Using Suffix Arrays and Clustering Based on Dirichlet Process Mixture Models2010

    • 著者名/発表者名
      Minoru Yoshida, Issei Sato, Hiroshi Nakagawa, Akira Terada
    • 雑誌名

      Proceedings of PAKDD-2010

      ページ: 230-237

    • NAID

      120007131162

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] 二段階クラスタリングを単語重み付与に応用した人名曖昧性解消2010

    • 著者名/発表者名
      吉田稔, 池田雅紀, 小野真吾, 佐藤一誠, 中川裕志
    • 雑誌名

      日本データベース学会論文誌

      巻: 9(2) ページ: 19-24

    • NAID

      40017420150

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] テキストマイニングの活用(解説記事)2010

    • 著者名/発表者名
      吉田稔, 中川裕志
    • 雑誌名

      情報の科学と技術

      巻: 60(6) ページ: 230-235

    • 関連する報告書
      2010 実績報告書
  • [学会発表] ニュース記事クラスタリングによる取引高予測の試み2012

    • 著者名/発表者名
      吉田稔, 中川裕志, 石田智也, 中嶋啓浩, 松井藤五郎, 和泉潔, 池田翔, 本多隆虎
    • 学会等名
      人工知能学会第25回全国大会
    • 発表場所
      盛岡
    • 年月日
      2012-06-02
    • 関連する報告書
      2011 実績報告書
  • [学会発表] ソーシャルメディアによる風邪流行の予測2012

    • 著者名/発表者名
      谷田和章,荒牧英治,佐藤一誠,吉田稔,中川裕志
    • 学会等名
      言語処理学会第18回年次大会
    • 発表場所
      広島
    • 年月日
      2012-03-15
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] ソーシャルメディアによる風邪流行の予測2012

    • 著者名/発表者名
      谷田和章, 荒牧英治, 佐藤一誠, 吉田稔, 中川裕志
    • 学会等名
      言語処理学会 第18回年次大会
    • 発表場所
      広島
    • 年月日
      2012-03-15
    • 関連する報告書
      2011 実績報告書
  • [学会発表] テキストマイニングによる機器異常診断支援の試み2012

    • 著者名/発表者名
      吉田稔,中川裕志,渋谷久恵,前田俊二
    • 学会等名
      第4回データ工学と情報マネジメントに関するフォーラム
    • 発表場所
      神戸
    • 年月日
      2012-03-04
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] テキストマイニングによる機器異常診断支援の試み2012

    • 著者名/発表者名
      吉田稔, 中川裕志, 渋谷久恵, 前田俊二
    • 学会等名
      第4回データ工学と情報マネジメントに関するフォーラム(DEIM 2012)
    • 発表場所
      神戸
    • 年月日
      2012-03-04
    • 関連する報告書
      2011 実績報告書
  • [学会発表] ニュース記事クラスタリングによる取引高予測の試み2011

    • 著者名/発表者名
      吉田稔,中川裕志,石田智也,中嶋啓浩,松井藤五郎,和泉潔,池田翔,本多隆虎
    • 学会等名
      人工知能学会第25回全国大会
    • 発表場所
      盛岡
    • 年月日
      2011-06-02
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Web People Search2010

    • 著者名/発表者名
      Minoru Yoshida, Hiroshi Nakagawa
    • 学会等名
      Person Name Disambiguation and Other Problems(Tutorial), the 2nd Asian Conference on Machine Learning(ACML 2010)
    • 年月日
      2010-11-08
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Web People Search : Person Name Disambiguation and Other Problems (Tutorial)2010

    • 著者名/発表者名
      Minoru Yoshida, Hiroshi Nakagawa
    • 学会等名
      The 2nd Asian Conference on Machine Learning (ACML 2010)
    • 発表場所
      Tokyo Tech Front, Tokyo
    • 年月日
      2010-11-08
    • 関連する報告書
      2010 実績報告書
  • [学会発表] ITC-UT2010

    • 著者名/発表者名
      Minoru Yoshida, Shin Matsushima, Shingo Ono, Hiroshi Nakagawa
    • 学会等名
      Tweet Categorization by Query Categrization for On-line Reputation management. WePS-3, CLEF 2010 Labs
    • 年月日
      2010-09-23
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] ITC-UT : Tweet Categorization by Query Categorization for On-line Reputation management2010

    • 著者名/発表者名
      Minoru Yoshida, Shin Matsushima, Shingo Ono, Issei Sato, Hiroshi Nakagawa
    • 学会等名
      WePS-3, CLEF 2010 Labs
    • 発表場所
      Padua, Italy
    • 年月日
      2010-09-23
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Person Name Disambiguation by Bootstrapping2010

    • 著者名/発表者名
      Minoru Yoshida, Masaki Ikeda, Shingo Ono, Issei Sato, Hiroshi Nakagawa
    • 学会等名
      SIGIR-2010 (the 33rd Annual ACM SIGIR Conference)
    • 発表場所
      Geneva, Swiss
    • 年月日
      2010-07-20
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Mining Numbers in Text Using Suffix Arrays and Clustering Based on Dirichlet Process Mixture Models2010

    • 著者名/発表者名
      Minoru Yoshida, Issei Sato, Hiroshi Nakagawa, Akira Terada
    • 学会等名
      PAKDD-2010 (The 14th Pacific-Asia Conference on Knowledge Discovery and Data Mining)
    • 発表場所
      Hyderabad, India
    • 年月日
      2010-06-23
    • 関連する報告書
      2010 実績報告書
  • [図書] Information Extraction from the Internet2011

    • 著者名/発表者名
      Minoru Yoshida, Hiroshi Nakagawa, AkiraTerada
    • 出版者
      On-demand Synonym Extraction Using Suffix Arrays, Chapter in Book
    • 関連する報告書
      2011 研究成果報告書
  • [図書] Information Extraction from the Internet (Chapter 5 : On-demand Synonym Extraction Using Suffix Arrays)2011

    • 著者名/発表者名
      Minoru Yoshida, Hiroshi Nakagawa, Akira Terada
    • 総ページ数
      256
    • 出版者
      iConcept Press
    • 関連する報告書
      2011 実績報告書

URL: 

公開日: 2010-08-23   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi