研究課題/領域番号 |
18H03342
|
研究機関 | 同志社大学 |
研究代表者 |
波多野 賢治 同志社大学, 文化情報学部, 教授 (80314532)
|
研究分担者 |
宮崎 純 東京工業大学, 情報理工学院, 教授 (40293394)
中村 匡秀 神戸大学, システム情報学研究科, 准教授 (30324859)
鈴木 優 岐阜大学, 工学部, 准教授 (40388111)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 大規模データアクセス / ソフトウェア開発 / サービス指向 / SQuaRE |
研究実績の概要 |
本研究では,さまざまなアプリケーションからデータを利活用する際,これまでは議論すらされてこなかったデータの品質に関して,データアクセス時にそれを考慮するアプリケーションを開発すると同時に,そのアプリケーションを容易に開発するためのソフトウェア開発環境をも構築する手法を提案するものである.このソフトウェア開発環境のための基盤は,アプリケーションにより異なるデータへのアクセス方法・機能を考慮しながら開発できる開発環境全体を指し,API群を整えることにより異なるデータアクセス方法を実現できるよう設計する.また,ソフトウェア開発を効率的に行えるよう,API群の利用状況に応じて自律的にデータを整理し実体化する機能をも兼ね備える. 本研究では,NoSQLDBによってデータ管理を行いながら,伝統的に用いられてきたRDBをベースとしたシステムアーキテクチャを踏襲することが一般であるという考えに基づき,このソフトウェア開発環境基盤を開発するために,前年度に引き続きデータ活用基盤技術とデータアクセス基盤技術の二種類の開発を行った. 前年度とは異なり研究する環境は改善されたが,本年度は前者の技術の進展がほとんどなかった点が大きな問題である.これは,予備実験においてデータ処理コストに関する性能改善が確認されたため本実験を行う段階に移ったが,その規模が大規模であったため,計算機ハードウェアの制限にかかり本実験を遂行できな状態になったためである.クラウド環境による実施も検討したが,費用の面で問題が起こっている.これに対し後者は,SQuaREに基づく品質の高いサービス開発の実現のために機械学習技術を導入することを試み,学習データの少なさから生じる諸問題をデータ拡張により改善し,ある程度はサービスの品質の高さを担保することが実現できた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究実績の概要でも触れたように,現在問題となっているのはソフトウェア開発環境基盤に必要な二種類の技術のうちデータ活用基盤技術に関する内容である.昨年度の問題点であったデータ処理コストの削減に関しては,提案によってある程度の性能を安定して出すことができることを予備実験において確認でき,かつ,データ量に対して比例してコストが増えていたこともあり,大規模データに対しても適用可能だろうと判断したが,実際はあるデータ量を超えた時点で急激に処理コストが増大することが判明した.これは,計算機ハードウェアのメモリ容量の問題により起こることであり,より高性能なハードウェアを使用すれば解消する問題である.しかし,現段階では所有機器に対するアップグレードやクラウド環境による処理の実行は,費用面を考慮すると遂行が不可能な状態となっているので,使用メモリの削減にスコープをあて研究を続けていく予定である. 以上のことから,データ活用基盤技術の問題点解決さえできれば,ソフトウェア開発環境基盤の実現は可能であると言えるため,来年度は前述の問題点の解決を早々に行い,ソフトウェア開発環境基盤上における開発コストの削減ができたかどうかの評価を行っていく予定である.もちろん,その他の部分についてもさらなるブラッシュアップができないかどうかを検討し,二種類の技術開発の更なる成熟化を図ることは行っていく予定である.
|
今後の研究の推進方策 |
本年度の進捗状況を踏まえ,最終年度となる次年度はデータ活用基盤技術とデータアクセス基盤技術の統合をシステムとして運用できるレベルで実装する. 研究実績の概要でも述べたとおり,データ活用基盤技術の開発に遅れが生じているため,使用メモリの削減にスコープをあて大規模データにおいても動作するよう改善を図っていくが,それと並行して双方の技術の統合を図り,実際にソフトウェア開発環境基盤として運用をすることも行っていく. また,データアクセス基盤技術は既に基本的な開発は終えているため,残りは質の高いサービスをAPIを用いて実現できるのかがテーマとなっている.したがって,この状況をさらなる高みに持ち上げるためにはこれらを統合したシステムを実運用の中で取り組むべき課題を発見し,それらを解決していく必要がある段階であると言える. そのため,当面は扱うデータはある程度小規模でありながらも,AWSなどのクラウド基盤上に両技術を統合運用できるソフトウェア開発基盤を開発・運用し,現状,それぞれの技術の問題が実運用ではどのような形で問題点を引き起こすのかを十分に調査し,それらを上手く改善できるような方法を検討できればと考えている.一番大きな心配事は,各研究グループの研究・開発に割ける時間の確保であるが,これまでの資産を十二分に活用し,研究・開発に避けるエフォートを増やそうという意識を持つことが重要であると考えている.
|