2022 Fiscal Year Research-status Report
IRにおける複雑化データの統計分析手法とそのツールの開発
Project/Area Number |
22K02714
|
Research Institution | Okayama University |
Principal Investigator |
飯塚 誠也 岡山大学, 教育推進機構, 教授 (60322236)
|
Co-Investigator(Kenkyū-buntansha) |
森 裕一 岡山理科大学, 経営学部, 教授 (80230085)
黒田 正博 岡山理科大学, 経営学部, 教授 (90279042)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | IRデータ / 尺度混在データ / 分析ツール / R |
Outline of Annual Research Achievements |
本研究では,IR分野を想定し,(1)尺度混在データに対する新たな分析方法,(2)視覚化,分析ツールの開発を目的としている。今年度は本研究の開始にあたり,IRデータ等の収集と整理を行い,その基本的な集計及び可視化を行った。集計,分析,視覚化という同様の処理を複数の部署ごとに適用する必要があるが,手作業で行う場合膨大な処理が必要となる。これらは(2)の課題に対応できるようにするため統一的に分析ができる環境が必要であり,それらを視野に入れ現状の整理を行った。 (1)については,申請者が従来より研究している質的データに対する多変量解析について,手法の改良を行い,実データへの適用可能性について検討した。具体的には,非計量データに対する主成分分析の計算アルゴリズムについて,vector epsilon アルゴリズムとリスタートを加えることによりより高速な計算ができること,また,IRデータにおいては,分類等も重要な観点となるためそのための手法の一つであるFuzzy Clusteringに関してもvector epsilonアルゴリズムによる計算の加速化を確認できた。これらの結果をもとに,これら手法のIRデータの適用可能性について検討を開始した。また,尺度混在データに対する分析手法のサーベイを進め,その中の主成分分析については,アルゴリズム等の検討を行い,実データへの適用可能性,変数選択の適用可能性について検討を行った。(2)では,分析ツールの開発についての準備を進め,ツールの開発には統計解析ソフトウェアRとそのパッケージを利用し進めることとした。そのための最新の技術動向やソフトウェアを取り巻く環境について現状の整理を行い,対話的なインターフェースをRのパッケージであるShinyで試作することを含めまとめと課題の整理を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
【研究実績の概要】で述べた目的のうち、1年目の研究目標としていたことは、基本的なデータ収集,調査及び基礎分析までを目標としており、現在のところその通りの進捗となっている。なお、大学業務との調整がつかず、海外を含め研究協力者との研究打合せは十分に行えなかった。
|
Strategy for Future Research Activity |
本研究における取組については,申請者等が従来行ってきた多変量解析に関する研究が重要であるがこれらの手法を今後量的変数,質的変数(テキストを含む)が混在した尺度混在データに拡張していくこととなる。これらの拡張にテキスト分析の観点を加え,新たな手法の開発を行っていく。また,分析ツールの開発については,従来著者らが実務で行ってきたプログラム等を改良し拡張していくことで可能になる。そのため次年度はこのプログラムの見直しについて推進していく。
|
Causes of Carryover |
今年度,購入を控えたテキスト分析ソフトウェアについては今年度購入を計画している。また研究成果の学会発表や研究打ち合わせ(主に海外)の旅費を見込んでいたが,大学業務との調整がつかず出張を控えたことで,当初の計画通りに執行できなかった。次年度は当初の予定通り情報収集ならびに成果報告に係る出張旅費として使用予定である。
|