研究概要 |
当該年度の研究実施計画に基づいて,頻出パターン抽出アルゴリズムの調査と選定,システム化を行った. 本研究の目的である,ソフトウェアレビューの熟練者と初心者における読み方の違いを分析するために,時系列データから頻出パターンを抽出するためのアルゴリズムについて文献を調査した.本研究で分析対象とする,開発者の視線移動情報は,データセットの数が少ない一方で,データセットの長さが数千アイテムに及ぶという特徴がある.これらの特徴を考慮した結果,PrefixSpanを採用した.PrefixSpanは他の頻出パターン抽出法であるaprioriベースのアルゴリズムと比べ支持数が小さい場合やパターン長が長い場合に性能面で優位であるため,本研究に適している. 上記アルゴリズムのシステム化においては,これまでの研究で作成したシステムを拡張する形で実装を行った.既存システムでは,レビュー対象である複数の文書(ソースコードや設計書)に対する視線を計測し,各行に対する視線の時系列情報に変換する.当該年度の拡張では,複数人の時系列情報を入力として,共通してみられる視線移動のパターンを自動的に出力するよう機能の追加を行った.システムの拡張によって,本研究の目的である不具合検出効率の高い読み方や,より網羅的な読み方,異なる文書や不具合の種類に対応した読み方の特徴の検出が可能になる.また,実装した機能について,過去の実験で得られたデータを用いて動作の確認を行った. 本研究で用いる視線計測装置について,計画当初は奈良先端科学技術大学院大学のソフトウェア工学講座が所有する装置を使用する予定であったが,同等の計測精度を有する装置を入手できた.装置の設置および各種設定を行い,高品質・高精度に計測できる環境を整えた.これにより,より効率的な研究の推進が可能になった.
|