研究課題/領域番号 |
18K11442
|
研究機関 | 北海道情報大学 |
研究代表者 |
内山 俊郎 北海道情報大学, 経営情報学部, 教授 (80708644)
|
研究分担者 |
甫喜本 司 北海道情報大学, 情報メディア学部, 教授 (00241373)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | トピックモデル / 解の多様性 / 解の分析と可視化 / 正規化相互情報量 / 多次元尺度法 |
研究実績の概要 |
2018年度は,まず分析方法の確立に取り組んだ。これまでに検討してきた内容(解同士の類似度を正規化相互情報量NMIにより測り,それを内積として定義し,関係性を分析・可視化する手法)をより具体的に記述した。また,文書データへの応用の研究に着手し、これまで他の研究で使われてきたものも含めた7種類の文書を用い,トピックモデルの解の推定方法としては3種類(事後確率最大推定、崩壊型ギブスサンプリング、崩壊型変分ベイズ推定)を用い(初期値設定法の工夫の有無も考える4種類),様々な初期状態(例えば50通り)から推定を開始することで,多様な解を得る実験を行った。提案の分析・可視化手法により,解の分布構造を可視化することができ,また解が推定方法に依存することを発見することができた。これらを国内外(国内の研究会2件、査読つき国際会議1件)で発表した。具体的には,国際会議(5th International Conference on Business and Industrial Research (ICBIR) 17-18 May 2018, pp.29-34)において、” A Method for Analyzing Solution Diversity in Topic Models”と題して発表し,この中で解同士の類似度を正規化相互情報量NMIにより測り可視化する提案手法を示すとともに,初期値による解の多様性を可視化して示した。電子情報通信学会のPRMU研究会(2018.6.28, pp.25-30)では、「トピックモデル解の多様性の分析」と題して発表し、様々な文書に対する実験結果を追加して示した。同様の内容を複雑系マイクロシンポジウム2019(2019.3.2, pp.43-48)において「トピックモデルの解の推定方法への依存性」と題して発表した。論文化の作業を進めている状況である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2018年度に予定していた、「分析方法の確立」については具体的な記述を行って、学会発表を行うことができた。また、「文書データへの応用の研究」に着手することについて、予定通り着手し、実験結果を得ることができた。提案した分析手法により、解の手法依存性について示すことができたことも含め、予定通りの成果が得られていると考えるから。
|
今後の研究の推進方策 |
本研究課題の進め方について,今現在変更の予定はありません。成果として示す段階ではありませんが,予定していた時系列データへの適用(モデル化)にも着手しています。
|
次年度使用額が生じた理由 |
物品費(ワークステーション)に必要な支出額の見積もりが多めであり,差額が生じたため。使用計画については、初年度の成果を学会発表や論文に掲載すること、実験をより効率的に行うための計算機リソースを導入することなどを予定している。
|