研究課題/領域番号 |
21H03505
|
研究機関 | 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
研究代表者 |
平尾 努 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (40396148)
|
研究分担者 |
木村 昭悟 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主幹研究員 (10396202)
奥村 学 東京工業大学, 科学技術創成研究院, 教授 (60214079)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 自然言語処理 / 談話構造解析 |
研究実績の概要 |
昨年度,イベント間の意味関係を修辞構造木として表現する動画談話構造解析がタスクとして定義可能であることを小規模なデータセットにおける2名のアノテータ間の一致に基づき示した.本年度は,データを拡充し,ニューラルネットワークに基づくベースライン解析器を構築しその結果を分析した.その結果(1)イベントに与えられた正解キャプションからイベントのベクトル表現を得た場合,その解析性能は人間に匹敵する,(2)しかし,自動生成キャプションからイベントのベクトル表現を得た場合には解析性能が大きく劣る,(3)動画から直接ベクトル表現を得た場合には,正解キャプションを用いた場合よりも性能は劣るものの自動キャプションを用いた場合よりも優れていることがわかった.さらに動画から直接ベクトル表現を得るためのエンコーダをあらかじめキャプショニングタスクで事前学習しておくと性能向上が得られることがわかり,今後研究を発展させていく上で重要な知見を得た.
また,テキスト修辞構造解析に関して,性能向上のためのデータ拡張法の研究にも取り組んだ.ニューラルネットに基づく解析器の場合,大量のラベルなしデータを自動的に解析した結果を擬似正解データとして解析器の事前学習することで性能が向上することが知られている.しかし,ラベルなしデータを十分に得ることができないテキスト領域ではこの手法は適用できない.これを解決するため,少量のラベルつきデータから逆翻訳を用いて大量の擬似正解データを生成する手法を考案し,その有効性を確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
動画談話構造解析のためのデータセットを整備し,ベースライン解析器を構築した.その結果より,自動キャプションを利用するよりも動画特徴をそのまま利用することが有望であることがわかった.さらに,動画エンコーダをキャプショニングタスクで事前学習することで性能向上が見込まれることもわかった.今後解析器を改善していく上で非常に重要な知見を得ることができたので今年度については計画通り達成できたと考えている.
|
今後の研究の推進方策 |
今後も計画通り進めていく予定である.
|