研究課題/領域番号 |
22K19800
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 東京理科大学 |
研究代表者 |
松崎 拓也 東京理科大学, 理学部第一部応用数学科, 教授 (40463872)
|
研究期間 (年度) |
2022-06-30 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
|
キーワード | 数学問題の難易度 / 自動演繹 / 数式処理 / 数学テキスト処理 / テキスト解析 / 数学問題の困難度 / 自動推論 |
研究開始時の研究の概要 |
数学問題に対する自動推論・数式処理による解答過程を分析することで,人にとっての数学問題の困難度を定量的に予測する.数学問題の困難さには, (a) 必要とされる計算の量,および (b) 必要とされる発想の質,の二つの要因があると考えられる.(a) 「必要な計算の量」については,解答に必要となる計算操作を入力とし,問題の平均点・分散を予測する回帰モデルを開発する.(b) 「必要な発想の質」については,発想の有用性および発想の難しさの指標として自動解答プロセスにおける計算量の削減を用いることで,解答に必要な発想の質を定量的に評価する.最後にこれらを総合し,問題の困難度を予測するシステムを実現する.
|
研究実績の概要 |
既存の数学問題を大量に学習データとして使用するために,数学テキストの言語解析に関する基礎処理について引き続き研究を行った.特に,数学テキスト中の数式のタイプを正確に予測するために,ニューラル言語モデルを用いた統計的予測と型理論に基づく形式的手法を組み合わせる手法について評価を行い,有効性を検証するとともにエラー分析に基づいてさらに改良するための指針を得た.この結果に関しては人工知能学会全国大会で発表した.また,左記の手法を含め,ニューラル言語モデルを応用する際にその挙動を理解するための基礎として,入力データにおける各トークンの位置を表す分散表現(位置埋め込み)の分析を進め,位置埋め込みにおける周期性の働きを明らかにした.この成果については国際会議 Empirical Methods in Natural Language Processing (EMNLP) 2023 で発表した. また,数学証明の議論構造を形式化し,その複雑さを分析するための基礎技術として証明の自動形式化について研究を行い,その成果を言語処理学会全国大会で発表した.当該の発表は大会優秀賞を受賞した. さらに,数式処理をエンジンとする数学的推論の過程を分析することにより数学問題の難易度を推定する方法について研究を進め,手法の概要を設計した
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
個々の問題の難易度を問題テキストを基に予測するための基礎技術の研究を進め成果発表を行った. 推論過程の分析により数学問題の難易度を推定する方法の概要を設計した.
|
今後の研究の推進方策 |
数式処理の過程を入力とし,問題で求められる「発想」を含めた推論の困難度を定量化する方法について,データに基づく分析を進め,適切な定量化方法を明らかにする.
|