2021 Fiscal Year Annual Research Report
テキストベースの深層学習における分類パターンの解釈支援
Project/Area Number |
19K12124
|
Research Institution | The University of Shiga Prefecture |
Principal Investigator |
砂山 渡 滋賀県立大学, 工学部, 教授 (40314398)
|
Co-Investigator(Kenkyū-buntansha) |
河原 吉伸 九州大学, マス・フォア・インダストリ研究所, 教授 (00514796)
西原 陽子 立命館大学, 情報理工学部, 教授 (70512101)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 深層学習 / パターン抽出 / 解釈支援 / データサイエンス / テキストマイニング |
Outline of Annual Research Achievements |
本研究においては,テキストベースの深層学習において,学習された分類パターンの意味を,人間が解釈できる環境の構築を目指した. 2019年度においては,ベースラインとなる解釈対象として,学習ネットワークをDNN(Deep Neural Network)とし,単語入力モデルにBoW(Bag of Words)を用いて深層学習を行ったネットワークに対して,分類基準の表現を1単語で表すシステムを構築し,その解釈を人間に促すためのインタフェースを構築した. 2020年度においては,2019年度に構築したモデルを拡張して,再帰構造をもつRNNモデルによる深層学習ネットワークを,HMM(Hidden Marcov Model)の構造に当てはめる手法により,学習結果の解釈を促す次の機能を有するインタフェースを構築した.1)分類パターンの抽出について,学習ネットワークにおいて,分類先と強いつながりを持つパスを一定数抽出.2)抽出されたパターンを視覚的に表示するため,分類先につながるパス(ノードとリンク)を表示し,各ノードに単語を付与して,どの単語がどの分類先につながるかを明示.また,時系列的にわかりやすくなるように,ノードのラベルは,学習に利用したテキストに実際に出現する単語の時系列パターンをもとに表示. 2021年度においては,作成したインタフェースの評価と検証を行った.評価実験においては,深層学習に不慣れな被験者が,インタフェース上に表示される,学習元のテキスト集合の分類パターンについて,特に単なる単語の組合せでなく,時系列パターンを意識したテキストの意味解釈が可能か,また,解釈した結果は妥当かを確認した.結果として,80%以上の割合で時系列を意識した解釈が行われ,またその内容のほとんどが学習元のテキストの内容に合っていたことが確認された.
|
Research Products
(7 results)