• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

手掛語と内容語の双対ブートストラップ・マイニング

研究課題

研究課題/領域番号 24500176
研究機関九州大学

研究代表者

廣川 佐千男  九州大学, 情報基盤研究開発センター, 教授 (40126785)

研究分担者 中藤 哲也  九州大学, 情報基盤研究開発センター, 助教 (20253502)
キーワード機械学習 / テキストマイニング / 属性選択 / SVM / 手がかり語
研究概要

機械学習の手法であるSVM(Suport Vector Machine)を使い、テキストデータの分類について新な手法を提案し、性能評価を行った。文単位の分析において属性選択を適用することで、推定性能が高くなる場合があることを、いくつかの事例で確認することができた。事例としては、有価証券報告書を対象として、利益伸び率の上位企業の特徴語の抽出を行った。その結果は、国際会議ESKM2013ならびにIRCITCS2013で発表した。自由記述のアンケートの分析については、学生による講議アンケートや、就農希望者アンケートの分析を行った。特に、講議アンケートについては、講議前、講議中、講議後に各学生がどのように考えていたかという具体的な課題を設定し、その課題への対応の良さが、学生の最終的な成績の推定性能と相関するという意外な結果がえられた。これは国際会議ICWL2013,SIGITE2013で発表した。就農アンケートについてはIEIS2013で発表した。また、手掛り語に着目する同様の手法をSNSサイトのデータに適用し、語学協調学習における間違いの種類を推定できることを示した。これはISEE2013,KES-IIMS213で発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

実験対象として想定していた企業情報やアンケートデータについて、SVMと属性選択を組合せた手法で、分類性能の向上ができ、論文として公表できたので目標は半分以上達成できた。しかし、ここで扱う属性選択は手掛り語についてだけであり、当初予定していた、内容語と手掛り語を双対的に扱うブートストラップについては未着手である。

今後の研究の推進方策

有価証券報告書の分析で行ったような、数値データによりターゲット文書群を特定し、SVMと属性選択によりその特徴語を抽出する研究を発展させる必要がある。具体的対象データとしては、医療関連テキストデータを準備する予定である。また、従来扱われていない観点、例えばWebでの健康情報の信頼性など、について、提案手法の有効性能評価を行う予定である。アンケートデータについては、講議アンケートを対象として、他の様々な観点についての分類での判定性能の評価を行う予定である。

次年度の研究費の使用計画

3年間の研究をまとめた成果を、国際会議ならびに雑誌論文として公表する予定である。また、とりまとめについてのコメントを関連研究者から受けるために、訪問する予定ある。そのための旅費等が必要となる
国際会議参加のための旅費ならびに参加費、雑誌論文の別づり費用、コメントをうけるための関連研究者訪問のための旅費を使用する予定である。

  • 研究成果

    (7件)

すべて 2013

すべて 学会発表 (7件)

  • [学会発表] Clustering English Writing Errors based on Error Category Prediction2013

    • 著者名/発表者名
      Brendan Flanagan, Chengjiu Yin, Kiyota Hashimoto, Sachio Hirokawa
    • 学会等名
      ISEEE2013
    • 発表場所
      バンコク
    • 年月日
      20131117-20131120
  • [学会発表] Correlation of Grade Prediction Performance and Validity of Self-Evaluation Comments2013

    • 著者名/発表者名
      Kazumasa Goda, Sachio Hirokawa, Tsunenori Min
    • 学会等名
      ACM SIGITE201
    • 発表場所
      オーランド
    • 年月日
      20131010-20131012
  • [学会発表] Integration of Sentence Based and Document Based Text Mining of Securities Reports for Prediction of \ Growth Rate of Operating Income2013

    • 著者名/発表者名
      Sachio Hirokawa
    • 学会等名
      IRCITCS 2013
    • 発表場所
      クアラルンプール
    • 年月日
      20130928-20130930
  • [学会発表] Prediction of Growth Rate of Operating Income using Securities Repo2013

    • 著者名/発表者名
      Tetsuya Nakatoh, Hirofumi Amano, Sachio Hirokawa,
    • 学会等名
      ESKM2013
    • 発表場所
      松江
    • 年月日
      20130831-20130904
  • [学会発表] Intellegent Computer Classification of English Writing Errors2013

    • 著者名/発表者名
      Bren Flanagan, Chengjiu Yin, Takahiko Suzuki, Sachio Hirokawa
    • 学会等名
      KES-IIMS2013
    • 発表場所
      セシンブラ
    • 年月日
      20130627-20130628
  • [学会発表] Analysis of Opinions from Questionnaire Surveys of Farming Candidates using Cross Tabulation System2013

    • 著者名/発表者名
      Makoto Okada, Sachio Hirokawa, Kiyota Hashimot
    • 学会等名
      KES-IIMS 2013
    • 発表場所
      セシンブラ
    • 年月日
      20130627-20130628
  • [学会発表] An Investigation of Oppinions and Demands of New Farming Applicants of Japan Using Concept Graph in The Questionnaire Survey2013

    • 著者名/発表者名
      Makoto Okada, Sachio Hirokawa, Kiyota Hashimoto
    • 学会等名
      IEIS2013
    • 発表場所
      新潟
    • 年月日
      20130616-20130619

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi