研究課題
基盤研究(C)
本研究では,法情報の広範な発信を目的に,法令の自動要約に取り組んだ.当初は機械翻訳の手法を利用したが期待した成果が得られなかったため,新たにランダムフォレストを用いて重要文を抽出する手法を開発し,これにより従来よりも高い性能を示した.研究の後半では,この成果を政治情報である議会会議録の要約にも適用し,ランダムフォレストに基づく新たな手法を開発した.この手法は,評価型ワークショップNTCIR-14 QA Lab-PoliInfoにおいて,参加7チーム14システム中,人手評価で2位,自動評価で1位の成績を収めた.
本研究成果における学術的な意義は,学習データが比較的少ない場合におけるランダムフォレストの有効性を示した点にある.現在有効とされるニューラルネットに基づく手法は大量の学習データを必要とするが,本研究の対象では大量のデータが用意できないため,そうした場合にはランダムフォレストの方が効果的であることを示した.また,機械学習における不均衡データに問題に対しても,漸進的アンサンブルランダムフォレストという手法を開発することにより,新たな解決策を示した.また,これまで取り組まれて来なかった法令や議会会議録の自動要約について成果を上げた点に,本研究の社会的意義がある.
すべて 2019 2018 2017
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) (うち国際学会 1件)
NII Testbeds and Community for Information Access Research - 14th International Conference, NTCIR 2019, Tokyo, Japan, June 10-13, 2019, Revised Selected Papers
巻: LNCS 11966 ページ: 110-121
10.1007/978-3-030-36805-0_9