2007 Fiscal Year Annual Research Report

単語間の関係表現を利用した多言語横断質問応答システムの研究

Research Project

Project/Area Number	19700140
Research Institution	Toyohashi University of Technology
Principal Investigator	土屋雅稔 Toyohashi University of Technology, 工学部, 助教 (70378256)
Keywords	質問応答 / 言語横断質問応答 / 対訳辞書作成 / 固有表現抽出 / 半教師有り機械学習
Research Abstract	多言語の質問応答システムを実現するには,単言語を対象とする質問応答システムと,複数言語を対象とする質問応答システムを組み合わせる必要がある.従来の質問応答システムの多くは,人手によって作成された規則などを多く用いているが,そのような方法では,複数の質問応答システムを効率よく作成することはできない.そのため,本年度は,機械学習の手法を用いて質問応答システムを作る方法を検討した.提案手法により,インドネシア語に対する質問応答システム,および,インドネシア語-英語を対象とする言語横断質問応答システムが作れることを示した.ただし,提案手法によって作成したインドネシア語-日本語を対象とする言語横断質問応答システムは,先行研究と比べて性能が良くなかった. また,言語横断の質問応答システムを作成するには,その言語対に対する大規模対訳辞書が不可欠である.しかし,世界中にはマイナーな言語も多く存在するので,そのような大規模対訳辞書は常に利用可能であるとは限らない.そこで,小規模な対訳辞書を大規模に拡充する手法を提案し,提案手法によって作成された辞書が言語横断情報検索タスクにおいて有効であることを示した. さらに,質問応答タスクを実現するには,そのサブタスクとして固有表現抽出が重要である.固有表現抽出には,教師有り機械学習が有効であることが既に知られている.しかし,現実世界では常に新規な固有表現が生まれ続けているので,常に豊富な学習データが利用できることは期待できない.そこで,少量のラベル付き学習データと大量のラベル無しデータを併用した半教師有り機械学習手法の適用を検討した.

Research Products
(4 results)

All 2007

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (2 results)

[Journal Article] Indonesian-Japanese Transitive Translation using English for CLIR2007
- Author(s)
  Ayu Purwarianti, Masatoshi Tsuchiya, Seiichi Nakagawa
- Journal Title
  
  自然言語処理 14
  
  Pages: 95-123
- Peer Reviewed
[Journal Article] A Machine Learning Approach for an Indonesian-English Cross Language Question Answering System2007
- Author(s)
  Ayu Purwarianti, Masatoshi Tsuchiya, Seiichi Nakagawa
- Journal Title
  
  IEICE Transaction on Information and Systems E90-D
  
  Pages: 1841-1852
- Peer Reviewed
[Presentation] A transitive translation for Indonesian-Japanese CLQA2007
- Author(s)
  Ayu Purwarianti, Masatoshi Tsuchiya, Seiichi Nakagawa
- Organizer
  情報処理学会自然言語処理研究会
- Place of Presentation
  静岡大学
- Year and Date
  2007-11-20
[Presentation] Expanding Indonesian-Japanese Small Translation Dictionary Using a Pivot Language2007
- Author(s)
  Masatoshi Tsuchiya, Ayu Purwarianti, Toshiyuki Wakita, Seiichi Nakagawa
- Organizer
  The 45th Annual Meeting of the Association for Computational Linguistics
- Place of Presentation
  プラハ,チェコ
- Year and Date
  2007-06-27

2007 Fiscal Year Annual Research Report

単語間の関係表現を利用した多言語横断質問応答システムの研究

Principal Investigator

土屋 雅稔 Toyohashi University of Technology, 工学部, 助教 (70378256)

Research Products

[Journal Article] Indonesian-Japanese Transitive Translation using English for CLIR2007

Author(s)

Journal Title

[Journal Article] A Machine Learning Approach for an Indonesian-English Cross Language Question Answering System2007

Author(s)

Journal Title

[Presentation] A transitive translation for Indonesian-Japanese CLQA2007

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Expanding Indonesian-Japanese Small Translation Dictionary Using a Pivot Language2007

Author(s)

Organizer

Place of Presentation

Year and Date

土屋雅稔 Toyohashi University of Technology, 工学部, 助教 (70378256)