自動推論プロセスの分析による人にとっての数学問題困難度の予測

Research Project

Project/Area Number	22K19800
Research Category	Grant-in-Aid for Challenging Research (Exploratory)
Allocation Type	Multi-year Fund
Review Section	Medium-sized Section 61:Human informatics and related fields
Research Institution	Tokyo University of Science
Principal Investigator	松崎拓也東京理科大学, 理学部第一部応用数学科, 教授 (40463872)
Project Period (FY)	2022-06-30 – 2025-03-31
Project Status	Granted (Fiscal Year 2022)
Budget Amount *help	¥5,980,000 (Direct Cost: ¥4,600,000、Indirect Cost: ¥1,380,000) Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000) Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000) Fiscal Year 2022: ¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Keywords	数学問題の難易度 / 自動演繹 / 数式処理 / テキスト解析 / 数学問題の困難度 / 自動推論
Outline of Research at the Start	数学問題に対する自動推論・数式処理による解答過程を分析することで，人にとっての数学問題の困難度を定量的に予測する．数学問題の困難さには， (a) 必要とされる計算の量，および (b) 必要とされる発想の質，の二つの要因があると考えられる．(a) 「必要な計算の量」については，解答に必要となる計算操作を入力とし，問題の平均点・分散を予測する回帰モデルを開発する．(b) 「必要な発想の質」については，発想の有用性および発想の難しさの指標として自動解答プロセスにおける計算量の削減を用いることで，解答に必要な発想の質を定量的に評価する．最後にこれらを総合し，問題の困難度を予測するシステムを実現する．
Outline of Annual Research Achievements	既存の数学問題を大量に学習データとして使用するために，数学テキストの言語解析に関する基礎処理について研究を行った．特に，（１）過去の大学入試数学問題テキストを用いて分野適応を行ったニューラル言語モデルを基に高精度なテキスト解析を行う技術，および（２）数学テキスト中の数式のタイプを正確に予測するために，ニューラル言語モデルを用いた統計的予測と型理論に基づく形式的手法を組み合わせる技術の研究開発を進めた．（１）に関しては，ニューラル言語モデルの分野適応のみによって，テキストの構文解析精度が約4ポイント向上することを明らかにした．また，その際の精度向上の大きな要因は，数学問題テキストで頻出する数式を含む並列構造の解析がより正確になることであると示した．また，分野適応の効果は問題テキスト中の数式をニューラル言語モデルへの入力においてどのように表現するかに依存し，数式を表す特殊なトークンで数式全体を置換する方法が最も効果的であることを明らかにした．（２）に関しては，統計的予測と形式的手法を融合した数式タイプ予測のための基盤システムの開発が完了し，高精度化のための改良をおこなっている．さらに，（１）（２）の技術の基礎となるニューラル言語モデルの挙動を理解し，高精度化するための基礎研究として，入力テキスト中のトークン位置の分散表現（位置埋め込み）の性質について分析を行い，トークン位置方向の時系列として見た場合の位置埋め込みには周期性が存在し，ニューラル言語モデルは，この周期性を基にトークン位置に基づく推論を行っていることを明らかにした．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 既存の数学問題およびその難易度のデータを基に，個々の問題の難易度を問題テキストを基に予測するための基礎技術の研究を着実に進めた
Strategy for Future Research Activity	これまでに開発した技術を基に，数学問題テキストからその問題内容の表現を自動的に得て，それを入力として問題の難易度を予測する統計モデルの研究開発を進める．また，数式処理および自動演繹の過程を入力とし，問題で求められる「発想」を含めた推論の困難度を定量化する方法について，データに基づく分析を進め，適切な定量化方法を探る．

Report

(1 results)

2022 Research-status Report

Research Products

(3 results)

All 2023 Other

All Presentation (2 results) Remarks (1 results)

[Presentation] BERTの教師なし分野適応による数学問題テキスト構文解析の精度向上要因の分析2023
- Author(s)
  吉田琉夏, 松崎拓也
- Organizer
  言語処理学会第29回年次大会
- Related Report
  2022 Research-status Report
[Presentation] 自己注意機構における注意の集中が相対位置に依存する仕組み2023
- Author(s)
  山本悠士, 松崎拓也
- Organizer
  言語処理学会第29回年次大会
- Related Report
  2022 Research-status Report
[Remarks] 本学学生が言語処理学会第29回年次大会において優秀賞を受賞
- URL
  https://www.tus.ac.jp/today/archive/20230330_1122.html
- Related Report
  2022 Research-status Report

自動推論プロセスの分析による人にとっての数学問題困難度の予測

Principal Investigator

松崎 拓也 東京理科大学, 理学部第一部応用数学科, 教授 (40463872)

¥5,980,000 (Direct Cost: ¥4,600,000、Indirect Cost: ¥1,380,000)

Current Status of Research Progress

Reason

Report

Research Products

[Presentation] BERTの教師なし分野適応による数学問題テキスト構文解析の精度向上要因の分析2023

Author(s)

Organizer

Related Report

[Presentation] 自己注意機構における注意の集中が相対位置に依存する仕組み2023

Author(s)

Organizer

Related Report

[Remarks] 本学学生が言語処理学会第29回年次大会において優秀賞を受賞

URL

Related Report

松崎拓也東京理科大学, 理学部第一部応用数学科, 教授 (40463872)