研究課題/領域番号 |
22KJ1921
|
補助金の研究課題番号 |
22J15958 (2022)
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 (2023) 補助金 (2022) |
応募区分 | 国内 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 京都大学 |
研究代表者 |
大村 和正 京都大学, 情報学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2023-03-08 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
1,700千円 (直接経費: 1,700千円)
2023年度: 800千円 (直接経費: 800千円)
2022年度: 900千円 (直接経費: 900千円)
|
キーワード | 自然言語処理 / 常識推論 / 自然言語理解 / 談話関係認識 / 蓋然的関係 / 談話関係解析 |
研究開始時の研究の概要 |
深層学習の発展に伴い、計算機の言語処理能力は長足の進歩を遂げているが、計算機による常識推論は未だ困難であることが報告されている。 本研究では、常識推論の中でも基本的な事態間の蓋然的関係(ある程度続けて起こりうる事態間の関係)を推論する能力に焦点を当て、この改善に取り組む。 まず、大規模テキストから自動獲得される蓋然的関係知識を用いた学習手法を検討し、知識を広範に学習したモデルを構築する。 続いて、テキストに表出することが少ない推論過程の情報を付与することで、より深い言語理解を問うデータを構築し、高度な常識推論を行うモデルの構築を目指す。
|
研究実績の概要 |
談話関係とは文間・節間の意味的な関係を指す.中でも「お腹が空いたので,ご飯を食べる」といった,一方が他方を引き起こし得る事態間に成立する談話関係を蓋然的関係と呼ぶ.本研究では,基本的な蓋然的関係を推論する能力(常識推論能力と呼ぶ)に焦点を当て,常識推論能力及び更なる言語能力をデータ駆動で改善する手法の開発に取り組んだ. 前年度までは,常識推論能力を評価するためのデータセットの構築,並びに自動生成データによる常識推論及び関連タスクへの効果の検証に取り組んだ.本年度はこれらの取り組みをまとめて論文化し,会誌「自然言語処理」への採録を進めた.この結果,論文は昨年9月に採録が決定し,2023年度の言語処理学会 論文賞を受賞した. また,当初の研究計画では基本的な蓋然的関係の推論過程を問う言語資源の構築を本年度の目標としていたが,近年登場したChatGPTをはじめとする大規模言語モデルに対して予備実験を行った結果,大規模言語モデルは概ね妥当な推論過程を生成できる傾向が確認された.そのため,本年度はこの方針ではなく研究の対象を蓋然的関係から談話関係全体に拡張し,談話関係を推論する能力の改善手法の開発に取り組んだ.具体的には,大規模言語モデルを用いた合成データの生成手法を開発し,合成データが談話関係認識の改善に有効であることを実証した.この成果をまとめた論文は今年3月に自然言語処理の主要国際会議LREC-COLINGに採択され,5月に発表を行う予定である.
|