研究課題/領域番号 |
25730139
|
研究機関 | 独立行政法人情報通信研究機構 |
研究代表者 |
藤田 篤 独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所多言語翻訳研究室, 主任研究員 (10402801)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 言い換え / パラフレーズ / 類型化 / 自然言語処理 |
研究実績の概要 |
本研究では,同一言語において同じ意味を持つ表現(言い換え)に関する網羅的な分類体系を,日本語,英語,仏語の比較対照に基づいて構築する.今年度は,(A)言い換え事例の効率的な収集・蓄積方法の検討,および(B)類型化の観点の整理およびそれらの組み合わせに基づく類型の定義に関して研究を行った.(A)については,前年度に開発した事例集積のための作業環境を,複数の作業者が匿名の状態で互いの作例を参照して知見を共有しながら作業を行えるように改良した.これと並行して,前年度までに列挙したプリミティブな類型の網羅性に関する評価を実施した.具体的には,含意関係認識に関するプロジェクト(RITE2)において人手で収集された,複雑な現象を含む言い換え事例163件を分解・分類する作業を経て,プリミティブであることを要件として事例を収集・蓄積するだけでは網羅性に限界があること,同義と認められる事例を分解することによってさらに広範な現象が観察可能であることが明らかになった.(B)については,言語横断的な分析に向けて,英語および仏語を母語とする連携研究者との間で,類型化の観点および手順について議論を進めた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
事例を収集・蓄積するための作業環境の開発は完了したが,当初計画における事例収集手法,すなわち内省および作例に基づく方法では現象の網羅性の担保が困難であることが明らかになり,方向転換について検討している.
|
今後の研究の推進方策 |
内省および作例に基づく事例の集積はいったん保留し,候補となる(複雑な現象を含みうる)事例の自動収集と分解に基づく事例の集積のアプローチで研究を進める.本研究の目的に対して,類似する現象を大量に獲得することは適切でなく,現象の多様性の担保が課題である.例えば,先行研究において,効率性を求めて過度なヒューリスティクスを持ち込むと,カバーできる現象の範囲が極端に限定されることが示されている.
|
次年度使用額が生じた理由 |
人件費・謝金に相当する額を繰り越した.これは,内省および作例に基づく事例の収集を開始する前のパイロットテストを通じて,上記の方向転換の必要性が明らかになったためである.新たな手法として,候補となりうる事例を収集する研究にはすでに着手しており,人間による評価を行なったが,この役務に対する対価は,所属機関の会計において「その他」に計上されている.
|
次年度使用額の使用計画 |
候補事例の評価ならびに複雑な現象を含みうる候補事例の分解にかかる人件費・謝金に充て,研究を推進する.研究成果を適宜学会等でも発表するため,旅費としても研究費を使用する.
|