研究課題/領域番号 |
22K19800
|
研究機関 | 東京理科大学 |
研究代表者 |
松崎 拓也 東京理科大学, 理学部第一部応用数学科, 教授 (40463872)
|
研究期間 (年度) |
2022-06-30 – 2025-03-31
|
キーワード | 数学問題の難易度 / 自動演繹 / 数式処理 / 数学テキスト処理 |
研究実績の概要 |
既存の数学問題を大量に学習データとして使用するために,数学テキストの言語解析に関する基礎処理について引き続き研究を行った.特に,数学テキスト中の数式のタイプを正確に予測するために,ニューラル言語モデルを用いた統計的予測と型理論に基づく形式的手法を組み合わせる手法について評価を行い,有効性を検証するとともにエラー分析に基づいてさらに改良するための指針を得た.この結果に関しては人工知能学会全国大会で発表した.また,左記の手法を含め,ニューラル言語モデルを応用する際にその挙動を理解するための基礎として,入力データにおける各トークンの位置を表す分散表現(位置埋め込み)の分析を進め,位置埋め込みにおける周期性の働きを明らかにした.この成果については国際会議 Empirical Methods in Natural Language Processing (EMNLP) 2023 で発表した. また,数学証明の議論構造を形式化し,その複雑さを分析するための基礎技術として証明の自動形式化について研究を行い,その成果を言語処理学会全国大会で発表した.当該の発表は大会優秀賞を受賞した. さらに,数式処理をエンジンとする数学的推論の過程を分析することにより数学問題の難易度を推定する方法について研究を進め,手法の概要を設計した
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
個々の問題の難易度を問題テキストを基に予測するための基礎技術の研究を進め成果発表を行った. 推論過程の分析により数学問題の難易度を推定する方法の概要を設計した.
|
今後の研究の推進方策 |
数式処理の過程を入力とし,問題で求められる「発想」を含めた推論の困難度を定量化する方法について,データに基づく分析を進め,適切な定量化方法を明らかにする.
|
次年度使用額が生じた理由 |
大規模なニューラルネットによる予測モデルの訓練には年度内に至らなかったため,予定していたGPUの購入を延期した.今年度前半に,その時点での性能/コスト比に優れた製品を選定し購入する予定である.
|