研究課題/領域番号 |
22K19811
|
研究機関 | 名古屋大学 |
研究代表者 |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
研究期間 (年度) |
2022-06-30 – 2025-03-31
|
キーワード | 自然言語処理 / 条件記述 / 確率・期待値の文章題 |
研究実績の概要 |
本年度は以下の研究を行なった。 1. 条件記述を構成する要素の整理:確率・期待値問題を解くためには、事象を規定する条件記述の日本語表現を実行可能なプログラムコードに変換することが必要となる。条件記述を構成する要素を、まず、属性値、属性名、述語、数値演算、制約表現、並列表現の6種類に大分類し、中分類16種類、詳細分類20種類となる分類体系を設計した。 2. 文脈自由文法によるコード合成:条件記述をコードに変換する過程を構文解析過程としてモデル化し、それを実現する辞書規則・構文規則を定義した。この体系は、組み立てるべきコードの型情報を非終端記号に用いる点に特徴がある。文法は、詳細分類に対応する辞書規則と、120個の構文規則から構成される。 3. 確率・期待値問題ソルバーの作成:サイコロまたは玉を題材とした確率・期待値問題を解くプログラムを作成した。まず、問題文を簡単なパターンマッチングで分解したのち、そこに含まれる条件記述を抜き出して、これをコードに変換する。そして、このコードを実行することにより、答を求める。 4. 例題集の作成とソルバーの評価:Q&Aサイトなどのオンラインソースからサイコロまたは玉を題材とした確率・期待値問題820題を収集し、例題集を作成した。作成したソルバーでこの例題集と解かせたところ、87%の問題を正しく解くことができた。解くことができなかった問題は、大きく(a)共参照を含む問題、(b)「交互に」などの複雑な状況を端的に表す表現を含む問題、(c)異なる複数のサイコロを含む問題(積事象の問題)、の3種類に分類される。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
条件記述を構成する要素の整理に関しては、属性値、属性名、述語、数値演算、制約表現、並列表現に大別し、それをさらに詳細分類した分類体系を作成した。本研究の中心的な課題である、条件記述のコードへの変換に関しては、試行錯誤を経て、文脈自由文法による構文解析過程としてモデル化し、実際に動作させるために必要な辞書規則を分類体系に基づいて作成すると共に、構成要素を組み上げると同時にコードを合成する120個の構文規則を定義した。これらの規則により、条件記述のコード変換を実現した。さらに、名付けを処理する機能を追加し、名付けされた要素が条件記述に含まれる場合も、処理できるようにした。作成したシステムを評価するために、サイコロおよび玉を題材とする確率・期待値問題をQ&Aサイト等から収集し、820題からなる例題集を作成した。それらの問題を作成したシステムで解かせたところ、87%の問題を解くことができた。以上のように、研究は順調に進んでいる。
|
今後の研究の推進方策 |
(1)CCGによるモデル化:現在の方法は、必要となる規則の数が多く、全体の見通しが良いシステムとなっているとは言い難い。そこで、文法記述の枠組みを、文脈自由文法からCombinatory Categorial Grammar (CCG)に変更して、より洗練された方法の実現を目指す。語彙化文法であるCCGは、リッチな情報を内在する辞書規則と少数の合成規則によって文法を記述する体系であり、現在の方法よりも必要な規則の数を大幅に削減できる可能性がある。 (2)仮想世界記述と試行の自動解釈の実現:サイコロを題材とした問題では、「何個のサイコロを何回振るか」だけで試行が記述され、その解析は容易である。これに対して、玉を題材とした問題では、どのような玉が何個あり(仮想世界記述)、それをどのように取り出すか(試行記述)がより複雑となる。この部分の記述の自動解釈に取り組む。研究が順調に進んだ場合は、対象をカードやコインを題材とした問題にも広げ、より多くの確率・期待値問題を解けるようにすることに取り組む。
|
次年度使用額が生じた理由 |
ジャーナル論文執筆に至らなかったため、少額(41,899円)の繰越が生じた。この繰越は、次年度のジャーナル論文の投稿料に充当する予定である。
|