研究課題/領域番号 |
18K11442
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 北海道情報大学 |
研究代表者 |
内山 俊郎 北海道情報大学, 経営情報学部, 教授 (80708644)
|
研究分担者 |
甫喜本 司 北海道情報大学, 情報メディア学部, 教授 (00241373)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2018年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | トピックモデル / 解の多様性 / 正規化相互情報量 / 多次元尺度法 / 単語分布 / 解の類型化 / 類似関係ネットワーク / 解のトピック分布 / 解の単語分布 / 単語分布のベクトル量子化 / 解の特徴分布 / 特徴のベクトル量子化 / 解の分析と可視化 / 確率的潜在意味解析 |
研究成果の概要 |
確率的潜在意味解析は、文書などを解析する手法であるトピックモデリングとして知られ、大量の文書からトピックを発見する目的で使われている。しかし、用いるアルゴリズムや初期値によりさまざまな解が得られるという問題がある。そこで本研究では、多数の解を求め、解に座標値を与えて解の分布を可視化する方法と、解として取りうる単語分布および典型的な解を見出す方法を提案した。これは「どのような解が存在するのか」を示すことであり、利用者が目的に沿った解を選択するうえで有用な情報となる。
|
研究成果の学術的意義や社会的意義 |
確率的潜在意味解析を含むトピックモデルの研究において、さまざまなアルゴリズムが提案され、性能の比較が行われてきた。アルゴリズムによる性能差があまり大きくない一方で、アルゴリズムや初期値によりさまざまな解に到達する問題があり、これらを分析して可視化する研究が学術的に重要であると考え、分析方法についての提案を行い、実験により有用性を確認した。トピックモデルは、大量の文書からトピックを見つける重要な手段であるが、多様な解の中から適切なトピックを選ぶことを可能にする本技術により、その有用性が増すので、本成果は社会的な意義があると考える。
|