2013 Fiscal Year Research-status Report
Project/Area Number |
24500176
|
Research Institution | Kyushu University |
Principal Investigator |
廣川 佐千男 九州大学, 情報基盤研究開発センター, 教授 (40126785)
|
Co-Investigator(Kenkyū-buntansha) |
中藤 哲也 九州大学, 情報基盤研究開発センター, 助教 (20253502)
|
Keywords | 機械学習 / テキストマイニング / 属性選択 / SVM / 手がかり語 |
Research Abstract |
機械学習の手法であるSVM(Suport Vector Machine)を使い、テキストデータの分類について新な手法を提案し、性能評価を行った。文単位の分析において属性選択を適用することで、推定性能が高くなる場合があることを、いくつかの事例で確認することができた。事例としては、有価証券報告書を対象として、利益伸び率の上位企業の特徴語の抽出を行った。その結果は、国際会議ESKM2013ならびにIRCITCS2013で発表した。自由記述のアンケートの分析については、学生による講議アンケートや、就農希望者アンケートの分析を行った。特に、講議アンケートについては、講議前、講議中、講議後に各学生がどのように考えていたかという具体的な課題を設定し、その課題への対応の良さが、学生の最終的な成績の推定性能と相関するという意外な結果がえられた。これは国際会議ICWL2013,SIGITE2013で発表した。就農アンケートについてはIEIS2013で発表した。また、手掛り語に着目する同様の手法をSNSサイトのデータに適用し、語学協調学習における間違いの種類を推定できることを示した。これはISEE2013,KES-IIMS213で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
実験対象として想定していた企業情報やアンケートデータについて、SVMと属性選択を組合せた手法で、分類性能の向上ができ、論文として公表できたので目標は半分以上達成できた。しかし、ここで扱う属性選択は手掛り語についてだけであり、当初予定していた、内容語と手掛り語を双対的に扱うブートストラップについては未着手である。
|
Strategy for Future Research Activity |
有価証券報告書の分析で行ったような、数値データによりターゲット文書群を特定し、SVMと属性選択によりその特徴語を抽出する研究を発展させる必要がある。具体的対象データとしては、医療関連テキストデータを準備する予定である。また、従来扱われていない観点、例えばWebでの健康情報の信頼性など、について、提案手法の有効性能評価を行う予定である。アンケートデータについては、講議アンケートを対象として、他の様々な観点についての分類での判定性能の評価を行う予定である。
|
Expenditure Plans for the Next FY Research Funding |
3年間の研究をまとめた成果を、国際会議ならびに雑誌論文として公表する予定である。また、とりまとめについてのコメントを関連研究者から受けるために、訪問する予定ある。そのための旅費等が必要となる 国際会議参加のための旅費ならびに参加費、雑誌論文の別づり費用、コメントをうけるための関連研究者訪問のための旅費を使用する予定である。
|
Research Products
(7 results)