研究課題/領域番号 |
20500149
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 近畿大学 |
研究代表者 |
山本 博史 近畿大学, 理工学部, 教授 (00395013)
|
連携研究者 |
隅田 英一郎 情報通信研究機構 (90395020)
安田 圭志 情報通信研究機構 (50395018)
ゴー チュイリン 情報通信研究機構 (90531616)
|
研究期間 (年度) |
2008 – 2010
|
研究課題ステータス |
完了 (2010年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2010年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2009年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2008年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 自然言語処理 / アライメント / 多言語化 / 半教師あり学習 / 固有名詞 / 確率付き制約 |
研究概要 |
本研究では、対訳文間単語アライメントを決定する際に、従来の単語情報だけでなく、品詞や、構文構造と取り入れることで、精度の向上を図る。この時、全ての学習コーパスに対して品詞や、構文情報を与えることは困難であるため、半教師ありの学習を行う。日英中の3ヶ国語パラレルコーパスに対し、品詞タグおよび固有名詞意味情報を用いた半教師ありアライメント学習を行い、効果が確認できた。さらに構文構造をアライメントに用いることで性能の向上が確認できた。
|