2006 年度研究成果報告書概要

多言語コーパスを利用した語義の瞹昧さ解消と続報記事抽出への適用

研究課題

研究課題/領域番号	17500091
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	山梨大学
研究代表者	福本文代山梨大学, 大学院医学工学総合研究部, 助教授 (60262648)
研究期間 (年度)	2005 – 2006
キーワード	コンパラブルコーパス / 多義語 / 対訳語 / 続報記事抽出 / 半教師つきクラスタリン / 言語知識獲得
研究概要	インターネットの普及により,膨大,かつ多様な情報がネットワーク上に溢れている.このような状況において,膨大な情報の中からユーザが指定した出来事に対し,その発生から後の経過を示す一連の内容を自動的に提示する技術(続報内容の抽出)は,ユビキタス情報社会における知的アクセス基盤を提供するだけでなく,過去の事例から将来起こりうる問題を予測し,実際に問題が発生する前に対処するための知識発見の技術としても発展が期待できる. 続報内容の抽出に関する研究は,統計手法や機械学習を用いて続報を示すラベルが付与された少数から成る事例の特徴抽出を行なう方法が主流となっている.しかしこのような時系列データでは,ある特定の機関においてユーザが指定した出来事を示す事例(正の事例)数は,それ以外の事例(負の事例)数に比べ極端に少ない.従って,統計や機械学習だけを用いた手法では精度面で限界があり,多様なコンテンツを扱う現実世界において充分に対処可能な枠組を提供しているとはいえない.この問題を解決するためには意味を中心に据えた自然言語処理技術が必須となる. 本研究では,実システムとして膨大な情報の中からユーザが指定した出来事に対し,その発生から後の経過を示す一連の内容を自動的に提示する技術(続報内容の抽出)に焦点をあて,続報内容の抽出精度に役立つ言語知識を抽出する手法を提案した.具体的には,(1)続報内容の分類に必要となる分野名の誤りを自動的に修正する手法,(2)高精度で続報内容を抽出するために必要となる分野階層の自動生成,(3)話題推移の抽出に有効な言語知識の調査,(4)日本語及び英語を対象としたコンパラブルコーパスからの対訳語義の抽出と関連記事抽出の手法を提案し,各手法において関連研究との比較を含めた手法の有効性を示した.

研究成果
(12件)

すべて 2006 2005

すべて雑誌論文 (12件)

[雑誌論文] Using Comparable Corpora and Semi-Supervised Clustering for Topic Tracking2006
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Proc. of the 21^<st> International Conference on Computational Linguistics and 44^<th> Annual Meeting of the Association for Computational Linguistics
  
  ページ: 231-238
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] Generating Category Hierarchy for Classifying Large Corpora2006
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Trans. of IEICE Information and Systems E89-E, 4
  
  ページ: 1543-1554
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] 分野の階層構造を利用したコーパスの誤り修正と文書分類への適用2006
- 著者名/発表者名
  福本文代, 鈴木良弥
- 雑誌名
  
  電子情報通信学会論文誌 J89-D, 3
  
  ページ: 552-566
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] マルチラベルの分野名タグに対する事例間類似度に基づいた誤り修正2006
- 著者名/発表者名
  濱野秀俊, 福本文代
- 雑誌名
  
  電子情報通信学会論文誌 J89-D, 10
  
  ページ: 2338-2347
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] Using Comparable Corpora and Semi-Supervised Clustering for Topic Tracking2006
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Proc. of the 21^<st> International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics
  
  ページ: 231-238
- 説明
  「研究成果報告書概要(欧文)」より
[雑誌論文] Generating Category Hierarchy for Classifying Large Corpora2006
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Trans. of IEICE Information and Systems J89-D, 3
  
  ページ: 1543-1554
- 説明
  「研究成果報告書概要(欧文)」より
[雑誌論文] Using Category Hierarchies for Correcting Category Errors and its Application to Text Classification2006
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Trans. of IEICE Information and Systems J89-D, 3
  
  ページ: 552-566
- 説明
  「研究成果報告書概要(欧文)」より
[雑誌論文] Correcting Category Errors in Multi-Labeled Data based on the Similarity between Two Examples2006
- 著者名/発表者名
  H.Hamano, F.Fukumoto
- 雑誌名
  
  Trans. of IEICE Information and Systems J89-D, 10
  
  ページ: 2338-2347
- 説明
  「研究成果報告書概要(欧文)」より
[雑誌論文] Using Category Hierarchies for Correcting Errors in Multi-Labeled Date2005
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Proc. of the 2nd Language and Technology Conference(LTC'05)
  
  ページ: 211-215
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] Topic Tracking based on Linguistic Features2005
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Proc. of the 2nd International Joint Conference on Natural Language Processing(IJCNL'05)
  
  ページ: 10-21
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] Using Category Hierarchies for Correcting Errors in Multi-Labeled Date2005
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Proc. of the 2nd Language and Technology Conference (LTC' 05)
  
  ページ: 211-215
- 説明
  「研究成果報告書概要(欧文)」より
[雑誌論文] Topic Tracking based on Linguistic Features2005
- 著者名/発表者名
  F.Fukumoto, Y.Suzuki
- 雑誌名
  
  Proc. of the 2nd International Joint Conference on Natural Language Processing (IJCNL' 05)
  
  ページ: 10-21
- 説明
  「研究成果報告書概要(欧文)」より

2006 年度 研究成果報告書概要

多言語コーパスを利用した語義の瞹昧さ解消と続報記事抽出への適用

研究代表者

福本 文代 山梨大学, 大学院医学工学総合研究部, 助教授 (60262648)

研究成果

[雑誌論文] Using Comparable Corpora and Semi-Supervised Clustering for Topic Tracking2006

著者名/発表者名

雑誌名

説明

[雑誌論文] Generating Category Hierarchy for Classifying Large Corpora2006

著者名/発表者名

雑誌名

説明

[雑誌論文] 分野の階層構造を利用したコーパスの誤り修正と文書分類への適用2006

著者名/発表者名

雑誌名

説明

[雑誌論文] マルチラベルの分野名タグに対する事例間類似度に基づいた誤り修正2006

著者名/発表者名

雑誌名

説明

[雑誌論文] Using Comparable Corpora and Semi-Supervised Clustering for Topic Tracking2006

著者名/発表者名

雑誌名

説明

[雑誌論文] Generating Category Hierarchy for Classifying Large Corpora2006

著者名/発表者名

雑誌名

説明

[雑誌論文] Using Category Hierarchies for Correcting Category Errors and its Application to Text Classification2006

著者名/発表者名

雑誌名

説明

[雑誌論文] Correcting Category Errors in Multi-Labeled Data based on the Similarity between Two Examples2006

著者名/発表者名

雑誌名

説明

[雑誌論文] Using Category Hierarchies for Correcting Errors in Multi-Labeled Date2005

著者名/発表者名

雑誌名

説明

[雑誌論文] Topic Tracking based on Linguistic Features2005

著者名/発表者名

雑誌名

説明

[雑誌論文] Using Category Hierarchies for Correcting Errors in Multi-Labeled Date2005

著者名/発表者名

雑誌名

説明

[雑誌論文] Topic Tracking based on Linguistic Features2005

著者名/発表者名

雑誌名

説明

2006 年度研究成果報告書概要

福本文代山梨大学, 大学院医学工学総合研究部, 助教授 (60262648)