研究分担者 |
竹田 正幸 九州大学, 工学部, 助手 (50216909)
井上 仁 九州大学, 工学部, 助手 (70232551)
篠原 歩 九州大学, 理学部, 助教授 (00226151)
篠原 武 九州工業大学, 情報工学部, 教授 (60154225)
松尾 文碩 九州大学, 工学部, 教授 (80037845)
|
研究概要 |
本研究は、高速パターン照合アルゴリズムの開発および全文情報処理への構造と機械学習の導入に主眼をおいて,SIGMAシステムの思想を活かしたワークステーションによる新しいテキストデータベース管理システムの開発を目的としている.本年度は,以下の成果を得た. (1)知的全文情報処理システムの設計に関しては,汎用性と万能性をできるだけ少ないコマンドで達成できるように,基本能力を設定した.また,ファイルシステムに関しては,汎用性とポ-タビリティを考慮してUNIXのものをそのまま使うことにした. (2)高速パターン照合アルゴリズムに関しては,先に考案しSIGMAシステム大型計算機版で実現した文字分割法をUratani-Takedaアルゴリズムへ適用して,読み飛ばし可能な高速アルゴリズムを開発した. (3)構造パターン照合アルゴリズムに関しては,T_EXソースを対象にして様々な括弧構造を扱えるようなアルゴリズムの開発に着手した. (4)ピクチャーパターン照合アルゴリズムに関しては,既に得ていた理論的な成果を実際のシステムとして実現するための基礎実験を済ませた. (5)知的全文情報処理システムにおける学習機能については,まず情報検索における質問文から質問者の意図を決定木の形に表す学習システムを開発した.また,テキストデータを高速な意味処理に耐えるようにするために,ある種の構文情報を付与する方式を研究し,その付与作業を機械学習の手法を用いて自動化するための基礎研究を行なった.
|