2016 Fiscal Year Research-status Report
Project/Area Number |
16K12564
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
武田 俊之 関西学院大学, 高等教育推進センター, 教育技術主事 (70227031)
|
Co-Investigator(Kenkyū-buntansha) |
森 秀樹 東京工業大学, 教育革新センター, 准教授 (30527776)
重田 勝介 北海道大学, 情報基盤センター, 准教授 (40451900)
|
Project Period (FY) |
2016-04-01 – 2018-03-31
|
Keywords | データ匿名化 / 学習履歴 |
Outline of Annual Research Achievements |
本研究の目的は,教育分野のデータについて,トレード・オフの関係にあるデータの有用性とプライバシー保護を両立するようなデータ匿名化ツールを開発することである。今年度は以下の研究をおこなった。 (1)個人情報保護法と匿名加工情報の調査。平成29年に改正される個人情報保護法と,そこで導入される匿名加工情報について情報収集と内容の検討をおこなった。匿名加工情報は法律家,技術者,研究者などの専門家の間でも合意があるものではない。また,その運用については,個人情報保護法保護委員会が概要を示した上で,各分野で決めるものとされている。 (2)MOOC(Massive Open Online Course)データの匿名加工の試行。所有するMOOCの学習履歴等のデータを,別の研究プロジェクトにおいて利用するために,匿名加工を試行した。k-匿名性を確保するよういくつかの変数を非撹乱的に加工した上で,サンプリングによる匿名加工をおこなった。また,ディスカッションフォーラムの書き込みを,成績や学習履歴を連結すると,匿名とはならないことを確認した。 (3)匿名化ツールのシステム・アーキテクチャの設計。既存のツール(ARX, SDCMicro)の調査をおこない,完成度の高いこれらのツールをライブラリとして利用するよう設計をおこなった。 (4)教育データ(変数、属性)の匿名化上の性質の検討。教育データの標準化形式であるxAPIやIMS CaliperはActor-Verb-Object-Result in Contextの形式である。一方教育研究では,実践のモデル化,変数の定義,測定,データ分析をおこなう。プライバシーリスクを評価するためには,教育データを統一的にあつかうことが可能な,教育研究とデータ形式をマッピングするフレームワークが必要である。今年度はこのフレームワークの初期バージョンを開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究予算の変更などにともない,いくつかの点で当初と研究開発の手順を変更したために,進捗が遅れている部分が生じている。 (1)新たに匿名加工情報の制度が導入される改正個人情報保護法が平成29年5月に施行される予定である。本研究は改正個人情報保護法の成立前に計画されたものであるが,この匿名加工という個人情報の加工法にあわせることによって,研究成果が活かされる機会が多くなると考えた。匿名加工情報は日本独自の概念であり,専門家の間でも技術的,制度的,社会的に合意があるものではなく,さまざまな観点からの情報の収集を優先的におこなった。情報収集は,法律,匿名化技術,統計的開示制御,医療情報,海外(特に欧州)における匿名化実務,個人情報保護法成立までのパーソナルデータに関する議論など多方面にわたる。 (2)教育データのリスク評価のために,文献整理をおこなう計画であったが,「研究実績の概要」で述べた分析のフレームワークを整える方が網羅的で有用であると判断,開発をおこなった。 (3)予算の制約もあり,匿名化ツールの開発はARX, SDCMicroという既存ツールを最大限活用したものに変更をおこなった。GUI開発はARXの画面を参考に,教育データのみで有用な機能に限定するような設計を検討中である。
|
Strategy for Future Research Activity |
平成29年度は計画通りに,匿名化ツールの開発と,教育データ匿名化のリスク評価の参照モデルを作成する。 (1)匿名化ツールの開発。①最も汎用でユーザビリティも高いARXを簡素化したGUIデザイン, ②ARXとSDCMicroのライブラリを利用した匿名化関数,③一般的な教育研究者も利用可能なワークフロー,④匿名加工実施後の基礎統計量の表示,が設計項目である。ツールは,PythonとRを組み合わせて実装する。 (2)教育データ匿名化のリスク評価の基礎となる参照モデルの作成。平成28年度に作成した教育データ・分析のフレームワークに,既存の文献をマッピングさせる。これにより,教育データの変数とその関連のデータベースを作成する。 (3) ツールの評価。実際のデータを用いて,匿名化ツールの評価をおこなう。評価は匿名化後の指標とユーザビリティにおいて計画している。 以上の内容について,研究発表をおこなうとともに,匿名加工の必要性と方法についても発表をおこなう。
|
Causes of Carryover |
研究開始後に匿名化ツール開発の手順を変更したために次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
教育データ匿名化のユースケースを整理するために使用する。
|