2018 Fiscal Year Annual Research Report
The Development of Anonymization Tool for Educational Data
Project/Area Number |
16K12564
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
武田 俊之 関西学院大学, 高等教育推進センター, 教育技術主事 (70227031)
|
Co-Investigator(Kenkyū-buntansha) |
森 秀樹 東京工業大学, 教育革新センター, 准教授 (30527776)
重田 勝介 北海道大学, 情報基盤センター, 准教授 (40451900)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 匿名加工データ / ラーニング・アナリティクス / 教育データの共有 |
Outline of Annual Research Achievements |
本研究の目的は,教育分野のデータについて,トレード・オフの関係にあるデータの有用性とプライバシー保護を両立するようなデータ匿名化ツールを開発することであり、研究期間において以下の研究をおこなった。 (1) 教育研究者および実践者自身が匿名化にたずさわることが可能なツールを開発した。まず、匿名化ツールの調査をおこない、ARX(GUIおよびJavaで記述)、sdcMicro(Rで記述)、Google Data Loss Prevention(オンラインライブラリ)を有用なツールとして選んだ。次に、これらの特徴、機能を活かしながら統合、連携してできるようなラッパーをPython言語で開発した。このライブラリは、pandasパッケージのデータフレームから利用することができる。これによってPythonによるデータ処理の前処理として匿名化をおこなうことができるようになった。 (2) 教育データの倫理的な取り扱いについて、研究、教育実践、法律、制度の各側面からレビューをおこなった。欧米の教育に関連する事例および日本の医療情報の事例の収集と、教育で生成、収集されるデータの種類の分類をおこない、倫理的な問題が生じるパターンについて検討をおこなった。日本はデータ利活用が優位であり諸外国にくらべてプライバシー保護上の課題は多い。 (3) 教育の研究および実践で用いられるデータを共有する場合に、どの変数が機微であるか、どのような変数の種別、属性について匿名化をすべきか検討をおこなった。機微情報以外の匿名化変数を自動的に識別することは困難であるが、(結合時を含めた)データ変数の組み合わせの個人識別性は匿名化ツールで分析可能になった。 以上の内容に関して、学会において報告と議論をおこなった。開発した匿名化ライブラリ(オープンソース・ソフトウェア)および教育データと倫理に関するレビューを公開予定である。
|
Research Products
(4 results)