教育コンテンツを高い精度で多量に収集できたとしても,そのままでは,必ずしも学習者にとって必要な情報を,理解しやすい形で提示できるわけではない.このため,平成27年度は,収集した教育コンテンツをその学習内容に応じて,自動的に関連づけ,分類・提示する手法を開発した.分類・提示手法を確立することで,教育コンテンツを体系化でき,学習者は,自分が学びたい内容を容易に選び出し,利用することができるようになる. 具体的には,それぞれのWebページの3次元空間中での座標については,対応分析により求めた.まず,Webページの文字コードを揃えるとともに,HTMLファイル内の,タグや,Webページのデザインのためのスタイルや,処理を行うためのJavaScriptの記述を削除した.その後,形態素解析ソフトChaSenを用いて,単語ごとに分割する処理を行い,出現頻度が高い順に,約200の単語を選択した.そして,各ページごとに,これらのキーワードの出現頻度のベクトルを作成し,この出現頻度のベクトルを特徴量として,対応分析を行った.対応分析は,テキストマイニングなどで広く利用される手法であり,類似度が高いもの同士を近くになるように配置することができる. 対応分析結果の表示には,X3Dを利用した.X3Dは,3次元空間を記述する言語であるVRMLの後継となる言語であり,XMLベースで3次元空間の記述を行うことができる.X3DをWebGLベースで表示するためのJavaScriptライブラリであるX3DOMを利用することで,Webブラウザ上で,関連するWebページの表示を実現した.
|