Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2002: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2001: ¥1,400,000 (Direct Cost: ¥1,400,000)
|
Research Abstract |
WWWの普及に伴い,ネットワークを通じてアクセスできる文書の数は急速に増加し続けている.そのため,大規模な文書の集合から有効な情報をすばやく獲得する技術(テキストマイニング技術)がますます重要になってきている.本研究では,この技術を確立させるために,情報可視化と情報検索の2つのテーマを平行に遂行し,それぞれのテーマにおいて今後期待できる有望な成果を得た. 最初のテーマは自己組織化マップを利用したテキストの可視化に関するものである.ここでは新しい並列アルゴリズムとしての一般化入力層分割法と呼ばれる手法を提案し,これを超小型化が期待できるデータ駆動メディアプロセッサ上で効率的に実現する手法を考案した.処理時間及び並列処理性の観点からその有効性を確認した. もう一つのテーマでは,上記の研究成果を適用する候補として,大量の新聞記事データに対して自然言語による質問応答システムのプロトタイプを開発した.このシステムは新聞記事の記述スタイルに関する事前知識を取り入れて開発されているので,辞書データベースの強化により更なる検索性能の向上が期待できる. 上記の研究成果を融合させ,検索に留まらず大量の新聞記事データから有効な知見を抽出することが今後の課題として挙げられる.
|