研究概要 |
本年度は,ソフトコンピューティングを用いた概念表現及び情報検索のための方式提案と,テキストプロセシング系及びマルチメディアデータ系において方式評価を行った.主な内容は下記の通り. 1.ソフトコンピューティング基礎検討: ファジィ論理及びラフ集合を用い,大規模データベースからの知識獲得,ルール抽出を行った.特に,ファジィ論理関数を用いた知識のルール化,及びラフ集合に基づく条件付確率の概念を用いたルール群の構築を試みて,その有効性を確認した. 2.CFS(Conceptual Fuzzy Set)による概念表現方式: ・コーパスからの最適化によるCFS構築方法を提唱した. ・ODP(Open Directory)に基づいたCFS構築方法を提唱した. ・synonymy集合を求めるための様々な指標(Information Gainなど)の性質を検証し,Artificial Brainの概念に基づいたCFS構築方法の基本的考え方を得た. 3.Precisiated Natural Languageの情報検索応用: ・UC BerkeleyのZadeh教授と共に,経済白書からのトレンド抽出及び動向予測へPresiciated Natural Languageの応用を試み,良好な結果を得た. 4.画像データの検索: ・テキスト情報に基づくWeb画像検索のための方式を提唱. ・画像認識と言語知識を統合した画像検索方式の検討を行い,布の検索のためのトイシステムで良好な結果を得た. 5.TREC(Text Retrieval Conference)コーパスを利用した手法評価: ・TREC2004 Web Track, Novelty Track, Genomics Trackに上記手法を使用し参加.データ量の確保をした状態での情報検索の評価を行った.また,次年度に向けての課題整理を行った.
|