研究課題/領域番号 |
26730155
|
研究機関 | 大阪大学 |
研究代表者 |
松本 真佑 大阪大学, 情報科学研究科, 助教 (90583948)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | クラウド / ウェブマイニング / ソフトウェアリポジトリ / MSR / トレンドマイニング |
研究実績の概要 |
本年度はトレンドマイニング技術のフレームワーク化に加え,実際のWebデータを対象に技術トレンド変遷のマイニングを試みた.フレームワーク化においては,実行基盤としてAWSを用い,システムへのアクセスをWebAPIとし,クライアントからのリクエストに応じてシステム上でデータのクローリングと整形,マイニングを行うシステムを試作した.マイニング対象となるWeb上のデータは,多少データ構造が崩れていてもブラウザが柔軟に対応してしまうこと,また各種ブラウザによって表記が異なる(ベンダプレフィックス等)などの特性があり,あらゆるデータを正しく収集することは困難である.ただし現状のシステムではW3Cの仕様に則った正しいデータであれば,概ね収集・マイニングが可能である.実際のトレンド変遷のマイニングにおいては,jQueryとWebの広告を題材として,時系列に伴うその変化の調査を行った.特にjQueryは現在でも半分近くのWeb上で利用されていること,JavaScriptの抱える問題点を浮き彫りにしその解決策を示したこと,その普及に伴って一部の仕様がW3Cの標準として取り込まれたこと,などの点から,Webの世界を大きく変える重要な技術であり,トレンド把握の調査題材として適していると考える.同様にWeb広告は現在の自由なWebを支える重要な技術であり,同時に広告遮断技術の普及という課題を抱えていることから,その調査に一定の意義が有ると考える.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
トレンド技術のマイニングフレームワークの試作は完了したものの,実際のWebを対象としたマイニング作業が予定より遅れているというのが現状である.遅延の理由としては,調査題材とする技術によって何をマイニングするか,それをどうマイニングするかの2点が大きく異なること,さらにWebを構成するソースコード(HTMLやJavaScript等)の表記方法に柔軟性があり,一定のルールのみでマイニングすることが困難であることなどの課題があり,その対策に予定より大幅な時間を要した.表記の柔軟性の例としては,あるHTMLの要素(DOM)を選択して操作したい場合は,NativeAPI / XPath / jQueryによるCSSセレクタなどの方法が存在する.解決策としてはソースコードを対象とした静的な解析だけでなく,実際にソースコードを実行する動的な解析が必要である.現在はこの動的な解析方法について検討中である.
|
今後の研究の推進方策 |
動的な解析方法の取り込みを検討するとともに,静的な解析のみで得られる調査結果をとりまとめる予定である.調査対象は引き続きjQueryとWeb広告を採用する予定である.前述の通りjQueryはWebに与えた影響が大きくその変遷に一定の関心がある.また,Web広告は現在の自由なWebを支える重要な技術である一方で,その遮断技術が普及しており,技術という観点から考えた際の歴史的な経緯,及び現状の把握を行うことで今後のWeb広告,さらにはWeb全体を考える重要な知見が得られる可能性がある.マイニング対象技術の性質を考える指標としては,速度やメモリといったクライアント上でのパフォーマンスだけでなく,バッテリ消費も取り込む予定である.Webはバッテリ駆動のモバイル環境で利用されるケースが極めて多いことから,トレンド技術がどのようにバッテリ消費に影響を与えているかという視点は,利用者の関心だけでなく開発者がより良い技術を採用する際の指針になると考えられる.
|
次年度使用額が生じた理由 |
研究計画が予定より遅れており,さらに発表予定としていた国際会議及び雑誌論文への投稿論文が採録されなかったことが原因である.そのため当該研究をもう1年継続し,不採録原因となっていた実験内容の不足とシステムの作り込みを行い,再度投稿を行う予定である.
|
次年度使用額の使用計画 |
物品費として論文の出版費用を,さらに旅費として国際会議への渡航・参加費用を予定している.
|