研究課題/領域番号 |
18K11440
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 立教大学 (2020) 長崎大学 (2018-2019) |
研究代表者 |
正田 備也 立教大学, 人工知能科学研究科, 教授 (60413928)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2018年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 機械学習 / テキストマイニング / トピックモデル / 深層学習 |
研究成果の概要 |
トピックモデルは、膨大な文書集合の中で扱われている多様な話題を自動的に抽出する技術である。しかし、トピックモデルによる通常のテキスト分析は、各文書での単語の出現頻度は考慮するが、語順は考慮しない。そこで、文書を単語列としてRNN(回帰型ニューラルネットワーク)でモデリングすることにより、トピックモデルを拡張する。RNNとトピックモデルを組み合わせる研究はすでにあるため、それらとは異なる手法を提案する。結果、従来とは異なる手法で文書を単語列としてモデリングするトピックモデルを提案した。だが、単語列をMLP(多層パーセプトロン)でモデリングするに留まり、RNNを組み合わせるまで到らなかった。
|
研究成果の学術的意義や社会的意義 |
20年近くテキストマイニングに使われてきたトピックモデルと、新しい技術である深層学習とを、どのように組み合わせれば効果的なテキストマイニングが実現できるか。この問いに本研究は取り組んだ。成果としては中途の段階ではあるが、従来研究でこの組み合わせを実現するために使われている変分オートエンコーダとは異なるアイディアにもとづいて、トピックモデルと深層学習を組み合わせる可能性が確かに見えたのは重要な成果である。この方向で研究を続ければ、膨大な文書集合に潜む多様な話題を抽出するツールとしてのトピックモデルを、深層学習による言語データのモデリングと組み合わせることで、さらに強力にすることができるだろう。
|