2019 Fiscal Year Annual Research Report
自動収集した大量のシラバス情報を用いたカリキュラムの定量的分析とその応用
Project/Area Number |
17H01837
|
Research Institution | The University of Tokyo |
Principal Investigator |
関谷 貴之 東京大学, 情報基盤センター, 助教 (70323508)
|
Co-Investigator(Kenkyū-buntansha) |
松田 源立 成蹊大学, 理工学部, 准教授 (40433700)
山口 和紀 東京大学, 大学院総合文化研究科, 教授 (80158097)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | シラバス / カリキュラム / 計算機科学 / クローリング / 機械学習 |
Outline of Annual Research Achievements |
年度の前半は、クローラ、判定ツール、データベース、の3つの部分からなる、シラバス収集支援システムを開発した。クローラは、キーワードに基づいてシラバスに関連する少数の入口となるウェブページを Google Search API を用いて抽出した上で、その入口からリンクされたウェブページを汎用ウェブクローラ Scrapy (https://scrapy.org) で大量に取得する。判定ツールは、シラバス情報の提供形態に合わせた Support Vector Machine の判定モデルを選択して、クローラが取得した大量のウェブページの中からシラバスとの関わりが強いページを見付ける。データベースは、ウェブページの中身を保持する文書指向データベース mongoDB と及びクローラによるページ取得に関する条件や取得日時、判定ツールの判定結果などのメタ情報を保持するオブジェクト指向データベース PostgreSQL である。 年度の後半は、国際的な大学のランキングの一つである Times Higher Education (THE) WORLD UNIVERSITY RANKINGS 2018 with computer science as subject に挙げられている大学のウェブサイトから、改めてシラバス情報を取得した。本システムを用いることでシラバス抽出に要する作業効率が上がっていることが定性的には分かった。現在、CS専攻の大学院生と同程度のウェブページを取得できているかどうかについては評価中である。 なお、主に前年度の成果について、査読付きの国際会議 (FIE2019) で報告した。また、シラバスかどうかの判定にニューラルネットワークの技術を適用する可能性について検討し、その基礎技術であるニューロ機械翻訳の成果を査読付きの国際会議 ( WAT2019) で報告した。
|
Research Progress Status |
令和元年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和元年度が最終年度であるため、記入しない。
|
Research Products
(2 results)