Research Abstract |
20年度は, 19年度までに提案され, 開発された手法を用いて, 概念知識構築アルゴリズムの改良と, エンジンの開発, システムの評価を次の順序で行った. 1. 概念知識構築アルゴリズムの改良とエンジンの開発 19年度までに提案したアルゴリズムの改良を行った. 具体的には, 19年度に開発したプロトタイプシステムを用いて, 分類精度などの評価を行った結果を元に,グループへの分類や, 上位下位関係の決定に用いる類似度判定のための距離尺度を見直した. また, グループ間の類似度を判定する際に, 辞書内に存在する全てのグループとの総当たりで判定していたが, これを上位下位関係を考慮した判定に変更した. 2. エンジンの開発 19年度に開発したプロトタイプシステムは, 辞書への記憶量や, 処理速度などを全く考慮していないシステムであったため, これらを実運用に耐えうるエンジンとするための開発を行った. システムの動作は, プロトタイプシステムと同様で. 共起情報とその頻度の集合を入力として与えると, 分類結果を辞書に格納する. また, 分類結果を視覚化して出力することも可能である. 3. システムの評価 開発したシステムを使用して, Web上の文書から共起情報を抽出し, 概念知識を構築させる. その結果を, 従来のクラスタリング手法などとの比較実験を行い, 評価を行った. なお, 共起情報の抽出のため, 大量の文書を収集する必要があったが, 研究の効率化のため, 既存のN-Gramデータを利用した.
|