2013 Fiscal Year Annual Research Report
意見文からなる大規模テキスト集合に潜む人々の価値観を推定するための基礎的研究
Project/Area Number |
25280118
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Kyushu University |
Principal Investigator |
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
|
Co-Investigator(Kenkyū-buntansha) |
冨浦 洋一 九州大学, システム情報科学研究科(研究院, 教授 (10217523)
高山 泰博 徳山工業高等専門学校, その他部局等, 准教授 (30565841)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 価値観推定 / 内容分析 / 価値観 / 国際情報交換 |
Research Abstract |
本研究では、ある事柄について書かれた意見に対し、その意見の背後にある価値観の自動推定手法を開発することが目的である。本年度は、主に価値観の自動推定の性能を良くするための推定手法そのものの開発と、自動的に推定された結果を評価するための新しい評価デザインに関して検討した。 ・価値観の自動推定手法 価値観の推定では、既に価値観が付与されているテキスト集合に既存の機械学習手法の改良や新しい統計的モデルを用いた手法を適用することにより、新たな文の価値観を自動的に付与する。実験対象データに対する価値観ラベルの付与は単純なカテゴリラベルの付与にくらべてコストが高いため学習に十分な量のテキストが得にくく、また一文あたりの単語の数が少ないため、既存手法をそのまま適用したのでは推定性能が低くなるという課題がある。そのため、まず、学習に用いるのと同内容のテキスト集合から統計的共起関係により自動抽出した語、およびシソーラス中で上位・同義関係にある語を用いて、学習用テキスト集合に対して連想語として補完することで推定性能を改善するアプローチを考案した。その結果、Support Vector MachineによりF値で6%の改善を得た。次に、文を構成する語が価値観を持ち、文の価値観は語が持つ価値観の論理和で表されるという仮説のもと、ベイズ統計を用いた新しい統計モデルを提案し、そのモデルに基づく推定プログラムを実装した。この結果については、現在、国際会議論文として投稿中である。 ・推定結果を評価するための新しいデザインの提案 従来から一般的に用いられている評価手法だけでなく、社会科学者がおこなっている内容分析の立場からの新しい評価デザインについて検討した。様々な角度からの検討を行っており、今後、論文としてまとめる予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
価値観推定手法の開発については、概ね計画通りであり、既存手法の改良による手法および新たな統計モデルによる手法を考案した。前者は、国際会議論文として公表し、後者には現在国際会議論文を投稿中である。推定結果を評価するための新しい評価デザインの提案に関しては、現在論文を執筆中である。
|
Strategy for Future Research Activity |
評価デザインの検討・分析に関しては、早急に論文にまとめて投稿することを目指す。
|
Expenditure Plans for the Next FY Research Funding |
計算用のコンピュータを購入予定であったが、これまで使用していたコンピュータで代用したため、購入を見合わせた。 また、国際会議に参加したが、日本で開催されたため、旅費がそれほどかからなかった。 コンピュータの購入に関しては、今年度、引き続き、検討する。 論文が採択された国際会議を中心に参加し、成果の公表を行なうとともに、関連分野の研究動向について情報収集する。
|
Research Products
(2 results)