研究分担者 |
朝田 健治 サイバー大学, 国際文化学部, 教授 (00465460)
松本 慎二 サイバー大学, 国際文化学部, 教授 (50454195)
西坂 朗子 サイバー大学, 国際文化学部, 助教 (30454193)
柵 富雄 (財)学習ソフトウェア情報研究センター, コンテンツ研究部, 主任研究員 (70470101)
|
研究概要 |
本研究は、独創的な<"働画知"、"自然言語知"、"メタデータ">という3項組みの知識表現形式と、最新のセマンティックWeb技術を活用するもので、国立科学博物館、旧教育情報ナショナルセンター(NICER)や(公財)学習ソフトウェア情報研究センターなどが公開しているデジタルアーカイブ資源を教育用デジタル学習資源として知識獲得、知識格納や、他システムでも知識利用できるようなe-Learning支援システムを構築するものである。 平成22年度の研究は、 Webページ・データベースを自然言語入力で検索するWebアプリケーションの実現を研究対象に選んだ。検索対象とするWebページは,形式知の自然言語によるテキストシナリオと,動画や静止画のデジタル映像ファイルを持つ.このテキストシナリオには映像ファイルの内容が記されており,これをデータベース化することで検索可能となり,共用が可能となった。 自然言語で表現された質問文書に対して索引語の重みベクトルを生成し,LSI法により索引語-文書行列を参照して類似度の高いWebページを検索・出力する。各Webページは,抽出された索引語を次元としたベクトル空間における文書ベクトルで表現され,その要素がTF-IDF値である,これらの文書ベクトルの集合を行列表現したものが索引語-文書行列である。 質問文章と検索結果の暗黙知を利用する適合性フィードバックシステムによって、容易に得られる類似性の良し悪し判断情報をWebページ検索システムに与え、検索結果を改善する研究を行った。
|