2012 Fiscal Year Research-status Report
Project/Area Number |
24500176
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kyushu University |
Principal Investigator |
廣川 佐千男 九州大学, 情報基盤研究開発センター, 教授 (40126785)
|
Co-Investigator(Kenkyū-buntansha) |
中藤 哲也 九州大学, 情報基盤研究開発センター, 助教 (20253502)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | ブートストラップ / 特徴語 / 機械学習 |
Research Abstract |
文書分析では、目的に応じて着目する特徴語は異なる。目的に合致する文を識別するための手掛語と、文を解釈のための内容語を双対的に求める制約付ブートストラップ法について研究した。 まず、理由を表す手掛り語に着目することで、倒産情報から、検索語に近いレベルの倒産理由を求めることができることを示した。また、関連語と検索語とレベル差が最小となる最適な制約があることを、観光ブログを対象として示した。 論文概要で問題を表す文とその手掛り語集合の抽出法を検討した。SVMにより得られるられるモデルの上位の特徴語に限定することで、問題文の判別性能を向上できることを示した。これは、機械学習の属性選択についての常識を覆す画期的な結果である。同じ手法をTwitterに適用し、感情的なメッセージと論理的なメッセージの識別が可能となることも確認できた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
制約付ブートストラップ法の有効性評価として、当初、倒産情報を対象とした制約を変化させることで、抽出結果として得られる特徴語の出現頻度を調整できるという予想していた。評価実験でこれを確認することができたので、計画は着実に進んでいる。WordNetにおける距離という尺度で有効性評価ができたのは、予想以上の進展である。 また、次年度以降に予定していた、文献情報やBlogやTwitterなどの他のデータについても実験を行うことができた。特に、文献情報については、機械学習における属性選択という問題に対し、最適な手掛り語集合というこれまでにない、新な展開が得られた。
|
Strategy for Future Research Activity |
当初の予定である一般の企業情報である有価証券報告書の分析に、制約付ブートストラップ法を適用し評価を行う。これまでは、倒産とか問題文というような2値評価ができる観点に対する手掛り語と内容語を検討してきた。昨年度に予想以上に進展があったので、観点として数量的分析も試みるため、重回帰分析を使ってみる。また、当初の予定であった英文データへの適用を行う。
|
Expenditure Plans for the Next FY Research Funding |
研究費としては、他大学の研究者訪問によるコメント聴取や、研究成果発表と評価意見を聞くための国際会議への参加、ならびに成果をジャーナルに出すための掲載料を中心的に考える。
|
Research Products
(3 results)