2023 Fiscal Year Research-status Report
習熟度推定モデルに基づくデジタル人材育成支援システムの開発
Project/Area Number |
22K12309
|
Research Institution | Ibaraki University |
Principal Investigator |
山本 一幸 茨城大学, 情報戦略機構, 准教授 (60826288)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 機械学習 / テキストマイニング / 情報リテラシー / 学習支援システム |
Outline of Annual Research Achievements |
本研究課題は、組織に特化したデータを学習データとした機械学習によるテキストマイニングを行い、特徴量を抽出し情報リテラシーに関する学習の習熟度を推定するモデルを開発することである。本研究課題の特徴として、組織に特化したデータとして、レポートや試験等の直接的なデータではなく、問い合わせ対応のデータ等の間接かつ時系列データから習熟度を推定することである。ここで問題となるのが一般的な機械学習の学習データと比べて組織に特化したデータは、データ量が少ない傾向にある。そのため開発したモデルの精度を高めるためには、学習データのクリーニングを適切に行い、習熟度を推定するモデルからノイズを除去する必要があると考えている。 2023年度は、2022年度で評価できていなかった時系列問い合わせデータによるモデル空間の検討を引き続きおこなった。また、問い合わせデータのカテゴリ分け手法の開発および、カテゴリごとの特徴量の抽出手法を開発した。データのカテゴリ分けには、経験的にメールの文面は、内容ごとにブロックになっていることが多いことが分かっている。ブロックごとに文書ベクトルを作成し、文書ベクトルをクラスタリングするように手法を開発している。特徴量の抽出は、クラスタライズされたデータから各々のブロックデータ内の単語の重要度をTF-IDFにより数値化し特徴量を抽出する仕組みを実装した。今後、開発したモデルについてデータセットごとに評価する必要がある。 また、学習データのデータノイズの除去した学習データを生成するクリーニングモデルについては、前年度に引き続き精度の向上に取り組んでいる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2023年度の研究計画では、問い合わせのカテゴリ分け手法の開発し、2022年度に作成したデータセットにより評価すること、およびカテゴリごとの特徴量の抽出手法の開発と2022年度データセットによる評価を計画していた。 2022年度で作成したデータセットを使って、時系列問い合わせデータのモデル空間の生成に取り組んだ。また、並行してモデル空間を使って、データセット内の各問い合わせのカテゴリ分け手法の開発およびカテゴリ分けされた問い合わせデータの特徴量の抽出手法の開発をおこなった。モデル生成では、GPUを使って高速に問い合わせデータの文書ベクトル化を行っているが、このコンピュータが故障したため、モデル生成が遅れている。 そのため、新しく開発したカテゴリ分け手法と特徴量抽出手法の評価ができていない。 これらの状況からやや遅れていると判断した。
|
Strategy for Future Research Activity |
本研究課題の核となる時系列問い合わせデータから開発したカテゴリ分け手法で得られたカテゴリとその特徴量を抽出する手法に対して評価が完了していない。これらの開発した手法に対して評価を完了させ、習熟度推定の精度を検証する必要がある。 2024年度は、開発した各手法の評価と、これまで開発したモデル、手法を組み合わせて情報リテラシー科目の習熟度推定を行うシステムの構築を進める。習熟度推定システムの精度の検証も行い、習熟度推定システムにおいて、学生が習熟できていないと推定されるトピックを表示する人材育成支援システムの構築を行う。
|
Causes of Carryover |
研究計画に遅れが生じてたため、研究会での発表および学術論文誌への投稿が遅れている。研究会等への出張費および学術論文誌への掲載料を使用しなかったために、次年度使用額が発生した。また、本研究を遂行する上で重要となる機械学習でのモデル生成に使用する計算機が故障し、次年度に修理するために次年度にまとめて部品購入に助成金を当てることを計画している。 また、学術論文誌への掲載料等への使用も計画している。
|