2014 Fiscal Year Research-status Report
データサイエンスの基盤:クラウドを活用したDandDインスタンスライブラリの構築
Project/Area Number |
26330048
|
Research Institution | Keio University |
Principal Investigator |
柴田 里程 慶應義塾大学, 理工学部, 名誉教授 (60089828)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | データサイエンス / インフラストラクチャー / DandD / インターフェース / 高次元データ / 可視化 / 国際研究者交流 / イギリス |
Outline of Annual Research Achievements |
データサイエンスの基盤として研究を進めたきたDandD (Data and Description) ルールをさらに深化させることで,より高度なデータサイエンス実践の環境を作りあげることを目的として本研究を開始した. まず,現存のDandDサポートシステム再構築の検討をおこなった.現在のクライエント・サーバシステムの形態は,コンピュータの能力の発達によりその必要性は薄れてきており,クラウド環境での利用も考えると,スタンドアローンなシステムに移行する必要がある.また,汎用性を考えるとWebベースのユーザインタフェースに利点があるが,高次元大規模データに対しては解像度,柔軟性,効率性など数々の問題があるため,これまでDandD と関連づけながら開発してきた高次元視覚化ソフトウエア TextilePlot をユーザインタフェースとして採用したほうがよいとの結論を得た.また,これまで DandD と解析ソフトウエア R の連携は,独自のブラウザを介してであったが,この機会にDandDサーバの機能の一つとして実装することにした. そこで,まずTextilePlot をユーザインターフェースとしたDandD サーバにRへの橋渡しをする機能を持たせた TRAD ( TextilePlot, R and DandD ) として統合したシステムを構築した.ハイパーリレーションの実装やDandDインスタンスライブラリーの構築をはじめとする数々の研究課題はこのシステム構築と平行して進める. 本年度はまず,DandD サーバにプロセス間通信を通じてRを呼び出す機能を実装し,東証株価データを題材として, Fama-Frencch 3 ファクターモデルの有効性を検証する実験をおこなった.さらに,TRAD として統合した.現在,データサイエンスのインフラストラクチャとしての評価をおこなっているところである.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初,困難であると思われた TextilePlot, R, DandD の一体化がスムーズに進行し,ひとつのスタンドアローンシステムTRADとして完成してきたため,今後の研究課題の遂行がかなり容易になった.TRADに統合する段階で,これまでの非能率な部分も解消し,ユーザインターフェースも大幅に改良されたため,データサイエンス実践のインフラストラクチャとして十分実用の域に達っしたシステムになるに違いない.
|
Strategy for Future Research Activity |
TRAD の基本的な開発はほぼ終了したので,これを公開できるレベルまでブラッシュアップするとともに,ハイパーリレーションやインスタンスの多重化などの機能の実装,実践の現場での経験の蓄積によるDandDインスタンスライブラリーの構築などを今後2年間精力的におこなっていく.
|
Causes of Carryover |
今年度は,研究計画の具体化に専念したため,物品費,その他経費を使用する機会が減少したため.また,学会も東京での開催であったため出張旅費の支出も少額となったため.
|
Expenditure Plan for Carryover Budget |
次年度は, TRAD の検証とその枠組みでのさまざまな研究課題の解決を図る予定であるので,諸経費の大幅な増加が見込まれる.そのために物品費などを使用する.また,学会も岡山大学で開催予定であり,加えて各地の研究者との連携を図るための出張もいくつか予定しているので,この面での出張旅費の増加も見込まれる.
|