物質・材料に特化した連想検索手法の検討を行うため、以下の1から3で示すように、ウェブ空間などの情報源から物質・材料に関する情報の収集や解析を行った。 1、Wikipedia内にある物質・材料に関連する語句の収集 Wikipediaサイトはカテゴリ構造のため、物質・材料に関するカテゴリ内のページを解析する事で、物質・材料のコーパスに含むべき語句の収集を行った。 2、特許データからの物質・材料に関連する語句の収集 物質・材料に関する特許データを用いて、物質・材料に関する語句の抽出を行った。具体的には既存のTF*IDF法を元に物質・材料に関連した特徴的な語句の抽出を行った。 3、物質・材料に特化した連想検索手法の検討 収集したウェブページや特許データから抽出した語句を用いて作成したコーパスをもとに、物質・材料に関する語句の連想検索手法の検討を行った。 また、当初の研究実施計画にはなかったが、所属機関において一般公開している物質・材料に特化したデータベースシステムのWebサイトのアクセスログの解析を行った。物質・材料に関するWeb検索サイトの構築を行うためにはユーザの検索行動を理解することが重要であり、この解析によって物質・材料研究に関わるユーザの特徴的な行動の抽出を行うことができた。 次年度では今年度構築した物質・材料に関するコーパスを用いてウェブ検索システムのプロトタイプを作成する予定である。
|