研究課題/領域番号 |
19K20333
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 筑波大学 |
研究代表者 |
若林 啓 筑波大学, 図書館情報メディア系, 准教授 (40631908)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 連語抽出 / 深層学習 / 能動学習 / 隠れマルコフモデル / 文書要約 / 対話システム / トピックモデル / クラウドソーシング / 自然言語教示 / 自然言語処理 / 遠距離教師あり学習 / 連語 |
研究開始時の研究の概要 |
機械翻訳における翻訳ミスや,対話システムにおける見当違いの対話応答,質問応答における質問意図の取り違えなど,自然言語処理アプリケーションの様々なエラーに共通する大きな原因に,複数の単語で特定の意味を持つ連語(collocation)の考慮ができていないという点がある.本研究では,文章から意味がありそうな単語の並びを抽出する連語抽出手法と,抽出された連語を精度向上に活かす連語を考慮した深層学習手法を発展・融合させることで,様々な自然言語処理アプリケーションの精度を改善する基盤技術を構築する.
|
研究成果の概要 |
本研究では,以下の3つの研究課題に取り組んだ.(課題A) テキストから意味のある連語をより高精度に抽出する技術として,連語の手がかりになる言語資源を活用した連語抽出モデル学習手法や,連語抽出モデルに対する効率的な教示手法を提案し,連語抽出に用いる統計モデルの基礎理論を発展させた.(課題B) 抽出された連語を活用して,文書要約,対話システムの言語理解,トピックモデリングの自然言語処理アプリケーションの精度を向上させる深層学習手法を提案した.(課題C) 後段の自然言語処理タスクの精度向上に寄与するような連語を,後段タスクの学習中に動的に抽出する手法を提案し,その効果を検証した.
|
研究成果の学術的意義や社会的意義 |
複数の単語で特定の意味を持つ連語を考慮することは,多くの自然言語処理のアプリケーションの精度を向上させるために重要な課題である.しかし,連語抽出手法の性質が,後段の自然言語処理タスクを学習する深層学習手法に与える影響については,これまで明らかにされてこなかった.本研究成果の意義は,連語の抽出と深層学習による自然言語処理タスクの精度向上を結びつける方法論を示し,その効果を明らかにしたことにある.とりわけ,連語を明示的に分析結果として提示するトピックモデリングや対話システムの言語理解タスクにおいて,直接的に応用可能な研究成果が得られたと考える.
|