• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

トピックの特性を言語間で比較・対照分析する多言語ウェブテキストマイニングの研究

研究課題

研究課題/領域番号 20300032
研究機関筑波大学

研究代表者

宇津呂 武仁  筑波大学, 大学院・システム情報工学研究科, 准教授 (90263433)

研究分担者 藤井 敦  筑波大学, 大学院・図書館情報メディア研究科, 准教授 (30302433)
キーワードディレクトリ・情報検索 / 多言語処理 / テキストマイニング / トピック分析 / ブログ / ニュース / スパムブログ / Wikiedia
研究概要

本研究では,ウェブ上で収集可能な多言語ニュース・ブログ・電子掲示板等の文書を情報源として,多言語での報道内容,関心動向や,意見の分布を分析し,国・文化・言語の間にどのような違いがあるのかを発見する過程を支援するテキストマイニング技術について研究を行った.平成20年度は,ウェブ上の多言語ニュース・ブログ等の各ジャンルにおいて,各トピックがどのような観点で強く関心を持たれているか,どのような意見を持たれているかを特定し,ジャンル間や言語間の差異の発見支援を行う手法について,以下の研究を行った。
(1)ウェブ上のテキストのジャンルとして,主に事実を報道するニュースと,主として一般利用者の意見や経験を伝えるブログとを対比的にとりあげ,ニュース,ブログ間で関連する項目や記述を相補的に検索する方式を実現した.これによって,ニュース・ブログという異ジャンル問で,観点の差異や意見の有無を発見する過程の支援が可能となった。
(2)ある同一のトピックについてまとまった規模の記述が書かれたブログサイトを,日英各言語について検索し,その記述内容を二言語間で対照分析する方式を実現した.これによって,同一のトピックが対象の場合でも,ブログ特有の個人レベルの関心が,日英ブログの間で異なっている様子や個人が持つ意見の分布が日英ブログの間で異なっている様子が容易に観測可能となった。
(3)機械学習の枠組みにより,ブログにおけるトピック分析の障害となるスパムブログ除去方式を実現した.また,能動学習の枠組みにより,年とともに変貌するスパムブログのうちの重要変化分を効率よく同定する方式を実現した。

  • 研究成果

    (4件)

すべて 2009 2008

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件)

  • [雑誌論文] Mining Cross-Lingual/Cross-Cultural Differences in Concerns and Opinions in Blogs2009

    • 著者名/発表者名
      Hiroyuki Nakasaki, Mariko Kawaba, Takehito Utsuro, and Tomohiro Fukuhara
    • 雑誌名

      Lecture Notes in Computer Science/Lecture Notes in Artificial Intelligence 5459

      ページ: 213-224

    • 査読あり
  • [学会発表] 機械学習を用いたスパムブログ検出における信頼度の利用2009

    • 著者名/発表者名
      片山太一,佐藤有記,宇津呂武仁,芳中隆幸,河田容英,福原知宏
    • 学会等名
      データ工学と情報マネジメントに関するフォーラム-DEIM-フォーラム-
    • 発表場所
      静岡県・ヤマハリゾートつま恋
    • 年月日
      2009-03-10
  • [学会発表] Cross-Lingual Blog Analysis by Cross-Lingual Comparison of Characteristic Terms and Blog Posts2008

    • 著者名/発表者名
      Hiroyuki Nakasaki, Mariko Kawaba, Takehito Utsuro, Tomohiro Fukuhara, Hiroshi Nakagawa and Noriko Kando
    • 学会等名
      2nd International Symposium on Universal Communication
    • 発表場所
      大阪府・大阪国際会議場
    • 年月日
      2008-12-16
  • [学会発表] Integrating a Phrase-based SMT Model and a Bilingual Lexicon for Human in Semi-Automatic Acquisition of Technical Term Translation Lexicon2008

    • 著者名/発表者名
      Yohei Morishita, Takehito Utsuro and Mikio Yamamoto
    • 学会等名
      8th Conference of the Association for Machine Translation in the Americas
    • 発表場所
      ハワイ・HiltonPrince Kuhio
    • 年月日
      2008-10-24

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi