ＷＷＷ上の多種メディア情報利用のための数値情報解析

研究課題

研究課題/領域番号	24500162
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
研究分野	知能情報学
研究機関	徳島大学 (2013-2014) 東京大学 (2012)
研究代表者	吉田稔徳島大学, ソシオテクノサイエンス研究部, 講師 (40361688)
研究期間 (年度)	2012-04-01 – 2015-03-31
研究課題ステータス	完了 (2014年度)
配分額 *注記	5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円) 2014年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2013年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円) 2012年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
キーワード	数値情報抽出 / レイアウト解析 / 表形式解析 / 数値表現解析 / テキストマイニング / 数値情報 / 表形式 / 数値表現
研究成果の概要	テキスト文書中の数値情報を対象とした検索を目的とし、そのために必要な処理、特に、数値の属性・話題の抽出問題に取り組んだ。様々なメディアの文書の解析を可能にするために、非構造的テキスト（文章など）と構造的テキスト（表形式など）どちらにも適用可能な数値およびその文脈の抽出手法を提案した。確率モデルを用いた教師なし学習を軸とし、Web文書レイアウト解析と表構造解析による属性や単位の抽出を行ったほか、数値を含む特徴的文字列の抽出手法の開発も行った。また、数値をコード化することで、単語と同様の確率モデルの構築、および、数値表現の索引付けが可能となり、メディアの形式に依らない検索が可能となった。

報告書

(4件)

研究成果
(11件)

すべて 2014 2013 その他

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (9件)

[雑誌論文] Extraction Japanese Slang from Weblog Data Based on Script Type and Stroke Count2014
- 著者名/発表者名
  Kazuyuki Matsumoto, Kyosuke Akita, Xielifuguli Keranmu, Minoru Yoshida and Kenji Kita
- 雑誌名
  
  Procedia Computer Science
  
  巻: 35 ページ: 464-473
- DOI
  10.1016/j.procs.2014.08.127
- 関連する報告書
  2014 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 新聞記事のテキストマイニングによる長期市場動向の分析2013
- 著者名/発表者名
  藏本貴久, 和泉潔, 吉村　忍, 石田智也, 中嶋啓浩, 松井藤五郎, 吉田稔, 中川裕志
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 28 号: 3 ページ: 291-296
- DOI
  10.1527/tjsai.28.291
- NAID
  130003362333
- ISSN
  1346-0714, 1346-8030
- 関連する報告書
  2012 実施状況報告書
- 査読あり
[学会発表] Reranking the Search Results for Lyric Retrieval Based on the Songwriters' Specific Usage of Words,2014
- 著者名/発表者名
  Kazuyuki Matsumoto, Sasayama Manabu, Qingmei Xiao, Fujisawa Akira, Minoru Yoshida and Kenji Kita
- 学会等名
  The proceedings of the 4th international conference on electronics, communications and networks (CECNet2014),
- 発表場所
  サンワールドホテル北京（北京、中国）
- 年月日
  2014-12-14
- 関連する報告書
  2014 実績報告書
[学会発表] Extracting Corpus-Specific Strings by Using Suffix Arrays Enhanced with Longest Common Prefix,2014
- 著者名/発表者名
  Minoru Yoshida, Kazuyuki Matsumoto, Qingmei Xiao, Xielifuguli Keranmu, Kenji Kita and Hiroshi Nakagawa
- 学会等名
  Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014), LNCS 8870
- 発表場所
  グランドマルゲリータホテル（クチン、マレーシア）
- 年月日
  2014-12-05
- 関連する報告書
  2014 実績報告書
[学会発表] Emotion Predicting Method Based on Emotion State Change of Personae according to the Other's Utterance2014
- 著者名/発表者名
  Kazuyuki Matsumoto, Fuji Ren, Qingmei Xiao, Minoru Yoshida and Kenji Kita
- 学会等名
  Proceedings of the 3rd IEEE International Conference on Cloud Computing and Intelligence Systems(CCIS2014),
- 発表場所
  香港理工大学（香港、中国）
- 年月日
  2014-11-29
- 関連する報告書
  2014 実績報告書
[学会発表] Unsupervised Analysis of Web Page Semantic Structures by Hierarchical Bayesian Modeling
- 著者名/発表者名
  Minoru Yoshida, Kazuyuki Matsumoto, Kenji Kita and Hiroshi Nakagawa
- 学会等名
  Proceedings of the Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) 2014
- 発表場所
  シャングリ･ラファーイースタンプラザホテル台南（台南市，中国）
- 関連する報告書
  2013 実施状況報告書
[学会発表] Identifying who drew the illustration focusing on the eyes of the characters
- 著者名/発表者名
  Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita
- 学会等名
  Proceedings of 20th Korea-Japan Joint Workshop on Frontiers of Computer Vision
- 発表場所
  沖縄工業高等専門学校（沖縄県）
- 関連する報告書
  2013 実施状況報告書
[学会発表] ソーシャルメディアからの地域固有表現の抽出
- 著者名/発表者名
  加藤宏紀, 荒牧英治, 宮部真衣, 吉田稔, 佐藤一誠, 中川裕志
- 学会等名
  第4 回集合知シンポジウム
- 発表場所
  東京
- 関連する報告書
  2012 実施状況報告書
[学会発表] 製品修理作業レポートと付随する数値データの関係性分析
- 著者名/発表者名
  山本忠, 吉田稔, 中川裕志, 渋谷久恵, 前田俊二
- 学会等名
  第15 回情報論的学習理論ワークショップ(IBIS2012)
- 発表場所
  東京
- 関連する報告書
  2012 実施状況報告書
[学会発表] テキスト中の数値情報マイニングと情報編纂：MuST 参加から見えてきたもの
- 著者名/発表者名
  吉田稔, 杉浦隆博, 廣川敬真, 山田剛一, 増田英孝, 中川裕志
- 学会等名
  人工知能学会第26 回全国大会(JSAI 2012)
- 発表場所
  山口
- 関連する報告書
  2012 実施状況報告書
[学会発表] 新聞記事のテキストマイニングによる長期市場動向の分析
- 著者名/発表者名
  蔵本貴久, 和泉潔, 吉村忍, 石田智也, 中嶋啓浩, 松井藤五郎, 吉田稔, 中川裕志
- 学会等名
  人工知能学会第26 回全国大会(JSAI 2012)
- 発表場所
  山口
- 関連する報告書
  2012 実施状況報告書

ＷＷＷ上の多種メディア情報利用のための数値情報解析

研究代表者

吉田 稔 徳島大学, ソシオテクノサイエンス研究部, 講師 (40361688)

5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)

報告書

研究成果

[雑誌論文] Extraction Japanese Slang from Weblog Data Based on Script Type and Stroke Count2014

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 新聞記事のテキストマイニングによる長期市場動向の分析2013

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] Reranking the Search Results for Lyric Retrieval Based on the Songwriters' Specific Usage of Words,2014

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Extracting Corpus-Specific Strings by Using Suffix Arrays Enhanced with Longest Common Prefix,2014

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Emotion Predicting Method Based on Emotion State Change of Personae according to the Other's Utterance2014

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Unsupervised Analysis of Web Page Semantic Structures by Hierarchical Bayesian Modeling

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] Identifying who drew the illustration focusing on the eyes of the characters

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] ソーシャルメディアからの地域固有表現の抽出

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] 製品修理作業レポートと付随する数値データ の関係性分析

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] テキスト中の数値情報マイニン グと情報編纂：MuST 参加から見えてきたもの

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] 新聞記事の テキストマイニングによる長期市場動向の分析

著者名/発表者名

学会等名

発表場所

関連する報告書

吉田稔徳島大学, ソシオテクノサイエンス研究部, 講師 (40361688)

[学会発表] 製品修理作業レポートと付随する数値データの関係性分析

[学会発表] テキスト中の数値情報マイニングと情報編纂：MuST 参加から見えてきたもの

[学会発表] 新聞記事のテキストマイニングによる長期市場動向の分析