研究概要 |
遺伝アルゴリズムを用いたメタ学習の観点から、複数手法を組み合わせてマイニングをおこなうことにより、より高度で効率のよいテキストマイニングシステムの開発を目指し、研究初年度として、以下の研究実績を得た。 1 WWW上に分散しているテキスト情報を統合するための基礎研究として、企業の情報をWWW上より検索し、これまで個々に表されていた情報を統合し、それらの情報を、企業評価を表す指標として加工することで、求職者に対してよりわかりやすい企業情報を提供するシステムを提案し、2005年度人工知能学会全国大会および、Knowledge-Based Intelligent Information & Engineering Systems,9th International Conference on Knowledge-Based Intelligent Information & Engineering Systems (KES' 2005)にて報告を行った。KES' 2005の結果はLecture Notes in Artificial Intelligence 3683,Springerに掲載された。本研究で作成したシステムでは、比較的フォーマットが決められている3つのWebサイトに的を絞って情報の抽出を行った。 2 データベース化されたテキスト情報からのマイニングのための基礎研究として、論文書誌情報から情報を抽出することによる研究動向の分析について、非線形問題分野の文献についてのデータベースに対して、論文に含まれている特定のキーワードや時系列データから、OLAPによる多次元データ分析による頻度分析を行い、そこからカオス研究分野、研究動向の調査をおこない、電子情報通信学会「非線形問題」研究会,信学技報に報告した。 3 複数手法の組み合わせによる自動文書分類手法の開発の基礎研究として、遺伝的プログラミングを用いて複数のテキスト分類アルゴリズムを組み合わせて、テキスト分類を行うシステムを提案し、第21回ファジィシステムシンポジウムにて報告した。本研究では、2つのアルゴリズムを用いて、SPAMメールを分類するシステムを提案した。
|