2007 Fiscal Year Annual Research Report
メタデータ付与の自動化と講義情報の配信による教育用コンテンツの流通促進
Project/Area Number |
19700657
|
Research Institution | National Institute of Multimedia Education |
Principal Investigator |
辻 靖彦 National Institute of Multimedia Education, 研究開発部, 助教 (10392292)
|
Keywords | シラバス / LOM / 情報抽出 / HTML解析 / 文書分類 |
Research Abstract |
19年度の成果を以下に示す。 ■LOM自動生成システムの開発 本研究で開発するLOM自動生成システムの目的を達成させるために、講義などのシラバスをインターネットから自動収集するWeb情報収集機能、収集したシラバス文書から項目を抽出する情報抽出機能、そして抽出した各項目をLOMフォーマットに変換するLOM自動生成機能を開発した。 (1)インターネット上に公開されている大学機関の講義・eラーニング教材・OCW用のシラバスを収集全国の大学などの高等教育機関においてWeb上で公開されているシラバスを収集した。シラバスはHTML、PDF、Word、Excelなどさまざまなフォーマットで公開されていることが考えられるが、初めの段階ではシラバスの大多数を占めると考えられるHTMLのみを対象とした。Web上のシラバスの収集方法としては、クローリングプログラムなどにより講義シラバスを自動的に収集する既存の手法を用いた。 (2)シラバスのWebページから項目情報を抽出する手法の開発と評価 収集したシラバスを解析し、「授業科目名」、「授業目的(講義のねらい)」、「専門分野」の項目情報を収集する手法を開発した。「授業科目名」、「授業目的(講義のねらい)」は、シラバス文書で登場する項目名と実際の項目値の対がHTMLソースの中でどのような位置関係で出現するかを調査し、位置関係を調べた上で、その位置関係に対応する形で項目情報の抽出を行う手法の開発を行った。「専門分野」については予め21の高等教育分野に属する専門用語辞書を作成し、その辞書に出てくる専門用語の頻度により分野を決定する。抽出精度を目視で確認する事で手法の評価を行った結果、高精度での抽出が確認できた。さらにWebインターフェイスを開発した。
|
Research Products
(1 results)