• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

Web・クラウド技術の利用事例検索のためのソフトウェアトレンドマイニング

Research Project

Project/Area Number 26730155
Research InstitutionOsaka University

Principal Investigator

松本 真佑  大阪大学, 情報科学研究科, 助教 (90583948)

Project Period (FY) 2014-04-01 – 2018-03-31
Keywordsクラウド / ウェブマイニング / ソフトウェアリポジトリ / MSR / トレンドマイニング
Outline of Annual Research Achievements

本年度はトレンドマイニング技術のフレームワーク化に加え,実際のWebデータを対象に技術トレンド変遷のマイニングを試みた.フレームワーク化においては,実行基盤としてAWSを用い,システムへのアクセスをWebAPIとし,クライアントからのリクエストに応じてシステム上でデータのクローリングと整形,マイニングを行うシステムを試作した.マイニング対象となるWeb上のデータは,多少データ構造が崩れていてもブラウザが柔軟に対応してしまうこと,また各種ブラウザによって表記が異なる(ベンダプレフィックス等)などの特性があり,あらゆるデータを正しく収集することは困難である.ただし現状のシステムではW3Cの仕様に則った正しいデータであれば,概ね収集・マイニングが可能である.実際のトレンド変遷のマイニングにおいては,jQueryとWebの広告を題材として,時系列に伴うその変化の調査を行った.特にjQueryは現在でも半分近くのWeb上で利用されていること,JavaScriptの抱える問題点を浮き彫りにしその解決策を示したこと,その普及に伴って一部の仕様がW3Cの標準として取り込まれたこと,などの点から,Webの世界を大きく変える重要な技術であり,トレンド把握の調査題材として適していると考える.同様にWeb広告は現在の自由なWebを支える重要な技術であり,同時に広告遮断技術の普及という課題を抱えていることから,その調査に一定の意義が有ると考える.

Current Status of Research Progress
Current Status of Research Progress

4: Progress in research has been delayed.

Reason

トレンド技術のマイニングフレームワークの試作は完了したものの,実際のWebを対象としたマイニング作業が予定より遅れているというのが現状である.遅延の理由としては,調査題材とする技術によって何をマイニングするか,それをどうマイニングするかの2点が大きく異なること,さらにWebを構成するソースコード(HTMLやJavaScript等)の表記方法に柔軟性があり,一定のルールのみでマイニングすることが困難であることなどの課題があり,その対策に予定より大幅な時間を要した.表記の柔軟性の例としては,あるHTMLの要素(DOM)を選択して操作したい場合は,NativeAPI / XPath / jQueryによるCSSセレクタなどの方法が存在する.解決策としてはソースコードを対象とした静的な解析だけでなく,実際にソースコードを実行する動的な解析が必要である.現在はこの動的な解析方法について検討中である.

Strategy for Future Research Activity

動的な解析方法の取り込みを検討するとともに,静的な解析のみで得られる調査結果をとりまとめる予定である.調査対象は引き続きjQueryとWeb広告を採用する予定である.前述の通りjQueryはWebに与えた影響が大きくその変遷に一定の関心がある.また,Web広告は現在の自由なWebを支える重要な技術である一方で,その遮断技術が普及しており,技術という観点から考えた際の歴史的な経緯,及び現状の把握を行うことで今後のWeb広告,さらにはWeb全体を考える重要な知見が得られる可能性がある.マイニング対象技術の性質を考える指標としては,速度やメモリといったクライアント上でのパフォーマンスだけでなく,バッテリ消費も取り込む予定である.Webはバッテリ駆動のモバイル環境で利用されるケースが極めて多いことから,トレンド技術がどのようにバッテリ消費に影響を与えているかという視点は,利用者の関心だけでなく開発者がより良い技術を採用する際の指針になると考えられる.

Causes of Carryover

研究計画が予定より遅れており,さらに発表予定としていた国際会議及び雑誌論文への投稿論文が採録されなかったことが原因である.そのため当該研究をもう1年継続し,不採録原因となっていた実験内容の不足とシステムの作り込みを行い,再度投稿を行う予定である.

Expenditure Plan for Carryover Budget

物品費として論文の出版費用を,さらに旅費として国際会議への渡航・参加費用を予定している.

  • Research Products

    (6 results)

All 2017 2016

All Presentation (6 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] Web閲覧時におけるJavaScriptライブラリ使用による副作用の調査2017

    • Author(s)
      山本将弘, まつ本真佑, 楠本真二
    • Organizer
      情報処理学会研究報告
    • Place of Presentation
      東京,早稲田大学
    • Year and Date
      2017-03-13 – 2017-03-14
  • [Presentation] 実装手段の異なるプログラムの実行時間と消費電力量に関する調査2017

    • Author(s)
      松尾裕幸, まつ本真佑, 楠本真二
    • Organizer
      情報処理学会研究報告
    • Place of Presentation
      東京,早稲田大学
    • Year and Date
      2017-03-13 – 2017-03-14
  • [Presentation] コード内コンテキストを用いた履歴情報取得のためのGitクライアントの拡張2017

    • Author(s)
      佐々木美和, 小倉直徒, まつ本真佑, 楠本真二
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      沖縄,那覇
    • Year and Date
      2017-03-09 – 2017-03-10
  • [Presentation] Evaluating Multi-Modal Speech Visualization Application for Deaf and Hard of Hearing People2016

    • Author(s)
      Yusuke Toba, Shinsuke Matsumoto, Sachio Saiki, Masahide Nakamura, and Tomohito Uchino
    • Organizer
      Applied Computing & Information Technology
    • Place of Presentation
      アメリカ,ラスベガス
    • Year and Date
      2016-12-11 – 2016-12-15
    • Int'l Joint Research
  • [Presentation] Web広告が閲覧デバイスに与える副作用の実証的調査2016

    • Author(s)
      中島弘貴, 松尾裕幸, まつ本真佑, 楠本真二
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      兵庫,神戸大学
    • Year and Date
      2016-11-04 – 2016-11-04
  • [Presentation] 共同開発環境におけるコーディングスタイルの変更に関する調査2016

    • Author(s)
      小倉直徒, まつ本真佑, 畑秀明, 楠本真二
    • Organizer
      電子情報通信学会技術報告
    • Place of Presentation
      滋賀,彦根
    • Year and Date
      2016-10-27 – 2016-10-28

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi