Budget Amount *help |
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2002: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2001: ¥1,500,000 (Direct Cost: ¥1,500,000)
|
Research Abstract |
本年は,超広域分散環境におけるソフトウェア開発環境に関する。様々な課題に対して取り組み,以下のような成果を得た. 超分散環境の一具体例であるオープンソースソフトウェア開発では,世界中に分散している開発者間が相互に互いの作業内容を報告する手段として電子メールが主に用いられており,それらの電子メールは単純にアーカイブとして蓄積されている.オープンソースソフトウェアに関わる開発者は,このアーカイブを検索することによって,過去の問題点,解決に至る経緯や議論の経過などを得ることができるが,必要とされる情報を特定する方法は,これまでアーカイブの全文検索技術に依存しており,特定の事項を効率良く検索することができなかった.そこで,電子メールによって行われる議論の単位としてスレッドを採用し,スレッド相互の関連を用いた電子メールアーカイブの検索システムの試作を行った.本システムでは,アーカイブ中のスレッドを特定した上で,各スレッド間に類似の話題や同一のファイルに対する話題等を事前に解析して,スレッド間の相互関係の抽出を行う.利用者からの検索要求があった場合には,通常の全文検索手法によって得られる結果と,スレッド間の相互関係から計算する類似のスレッドの両方を検索結果として提示する.オープンソースの一つであるFreeBSDの開発事例を用いて,試作したシステムの評価実験を行った結果,本システムは既存の全文検索システムよりも良い検索精度を持つことが明らかとなった. 超広域分散環境は主にインターネット上に構築されているが,そのインターネット上では文書がHTMLやその改良版であるXHTML等のマークアップ言語によって記述されている.マークアップ言語による文書は,一般的に文書内で静的に記述される文書内容と,スクリプト等によって記述された,動的に決定される文書内容が混在している.マークアップ文書を正しく記述するためには,マーク付けが構文通り正しく行われているかを事前に確認する必要があるが,既存の構文チェック手法では,動的に決定される文書内容を無視しているため,実際には構文誤りを含む文書に対して誤りを検出できないことがあった.そこで,マークアップ言語としてXHTMLを取り上げ,動的に決定される内容が含まれる文書の構文チェックを行う手法の提案を行った.本手法は,動的に記述された内容を文書パターンとして正規表現を用いて静的な記述に変換した上で,静的に記述された文書とあわせた構文チェックを行うものである.本手法を用いることにより,文書の構文誤りを事前に検出することが可能となるため,文書を用いた開発者の情報交換を正確に行うことができると期待される.
|