Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2010: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2009: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2008: ¥600,000 (Direct Cost: ¥600,000)
|
Research Abstract |
本研究の目的は以下の3点である. 1.特定のトピックに関するブログ中での感情,意見,評価を自動的に抽出するモデルをいくつかの言語で開発する(まず日本語とタイ語のブログを対象とする), 2.他の言語に移植可能な程度に拡張性および一般性を有する,意見マイニングのための多観点でかつ言語横断なブログ検索の枠組みを提案する, 3.本研究ではまず日本語とタイ語のブログを対象とするが,いくつかの言語を対象とした言語横断ブログ検索のプロトタイプシステムを開発する. 今年度は, 1)機械翻訳エンジンと機械学習技術を用いて,資源の乏しい言語における目標データを予測するために,資源の豊富な言語のラベル付きデータを利用する,多言語のテキスト分類モデルを開発することを目的とし, 2)テキスト評価分析のためのデータ集合を構築した.データセットは,互いに翻訳関係にある日本語,タイ語,英語の文の集合である.提案モデルの実証に用いる予定である. 3)確率モデル,機械学習、最適化技術を元に,理論的,実験的に問題を解決できる仮説を現在検討中である.
|