2020 Fiscal Year Research-status Report
社会調査的「知」とAI的「知」の比較検討-コミックマーケット調査の再分析
Project/Area Number |
20K20778
|
Research Institution | Kyushu University |
Principal Investigator |
杉山 あかし 九州大学, 比較社会文化研究院, 准教授 (60222056)
|
Project Period (FY) |
2020-07-30 – 2023-03-31
|
Keywords | 人工知能 / 社会調査 / ニューラルネットワーク |
Outline of Annual Research Achievements |
社会調査における人工知能(AI)の利用可能性を探るのが本研究の目的である。 初年度である本年度は、Sony の Neural Network Console(以下、NNC)を用いて、コミックマーケット30周年調査と40周年調査において、サークル参加申請者より得たアンケート調査データ(以下、本データ)の分析に着手した。 そもそも NNC は本データの分析に相応しいか、ということを念頭に置きながら、欠損値を取り除いた30年調査のデータを用い、「性別」「職業」「年齢」「学歴」のいずれかを従属変数に、それ以外の設問を説明変数に設定し、2クラスと多クラス分類を行った。結論からいえば、2クラスの「性別」分類は精度8割以上の判別ができたが、それ以外の分類はうまくいかなかった。 NNC は「性別」の判別に有効と言えようが、しかし、従属変数に「性別」を設定し、2項ロジスティック回帰分析を行うと、やはり精度が8割以上の判定結果が得られる。AIがこれまでの統計手法に近い有効性を発揮したともいえるが、これまでの統計手法に代わる有効な手段と言えるのかと言えば、判断に困る結果と言える。そこでAIの限界を探るべく、意図的に過学習をさせてみた。結果としては、精度99%超えの判別結果が得られた。これはいわば、すべての回答セット(質問紙調査として言うならば「個票」)に個別に対応し、分類するアルゴリズムが構成されてしまった結果と考えられる。比喩的に言えば、すべての回答用紙を「暗記」してしまった状態であり、当然、その回答の1項目を当てることはたやすいという状況である。ノイズまでも最適化されてしまうニューラルネットワークの問題点が出来したと言え、AI分析の留意点の一端が明らかとなった。 このほか、いくつかの変数を取り上げ、回答間の関連性をAIに見つけ出させる実験を試行中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究初年度の最大の課題は、ニューラルネットワークによる分析環境(ハード・ソフト、およびそれを使いこなすスキル)の整備であり、これについては順調に進み、実際に試行的分析を行うに至った。研究は順調に進展していると言える。
|
Strategy for Future Research Activity |
順調に推移しているので、計画通りに研究を推進して行く。
|
Causes of Carryover |
本研究計画に必要な処理能力を満たすワークステーションの価格が、技術革新により低下したため、予定予算より使用予算が減額となった。 一方、当初アルバイトとして学生を短期雇用し、研究補助をしてもらう予定であったが、プログラム操作技能の蓄積が必要であることが判明したので、専門技能を有する者1名を研究期間を通じテクニカルスタッフとして雇用することとした。人件費が、特に後年次において予定より上昇するため、これに次年度使用額を充てる。
|