2015 Fiscal Year Annual Research Report
Project/Area Number |
24700097
|
Research Institution | University of Hyogo |
Principal Investigator |
湯本 高行 兵庫県立大学, 工学(系)研究科(研究院), 助教 (20453152)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | ハウツー情報 / 情報組織化 / 手順 / 評判情報 / 機械学習 |
Outline of Annual Research Achievements |
(1)ハウツー情報を構成する手順の抽出手法についてSupport Vector Machineを用いた手法の開発を行ってきたが,さらなる素性の検討を行い,精度を向上させた.また,複数のハウツー情報掲載ページから手順の重要さおよび順序を決定することで要約を生成する手法について研究を行った.さらに,これらの手法を応用したハウツー情報の閲覧システムを開発した.このシステムでは,典型性によるフィルタリングや特定の手順を含むページの検索が可能であり,典型的な手順の把握や特徴的な手順の発見などが可能である.また,重要性の新たな指標としてページと内容の含意関係の2部グラフにリンク解析を適用した手法を,独自性の指標としてコーパス中での出現確率を基にした非典型度の指標を開発した. (2)ハウツー型情報を対象に開発した手法を評判情報およびファクト型情報に応用した.評判情報については商品レビューから属性と意見のペアをSupport Vector Machineを用いて抽出する.また,抽出性能を向上させるため,前処理として,文の役割を判別する手法を開発した.この手法は,Support Vector Machineを用いて,文を意見,説明,エピソードに分類する.また,ファクト型情報ではニュース記事を対象として,辞書,編集距離,文脈内で一致度合いなどを考慮して文の間の内容の対応関係の判定を行う.また,2つのニュース記事の共通部分と差異を抽出して可視化するシステムを開発した. (3)機械学習に用いる学習データの大規模化を容易にするために,既存のソーシャルメディアデータから擬似的な学習データを生成し,これを用いて分類器を構築する手法の改良を行った.具体的には,2値分類器を組み合わせる際の最適なしきい値を求め,これに基づいて多値分類器を構築する.
|