自然言語処理におけるインターネットコーパスの応用に関する研究

研究課題

研究課題/領域番号	14580411
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	電気通信大学
研究代表者	古郡廷治電気通信大学, 電気通信学部, 教授 (80114932)
研究期間 (年度)	2002 – 2003
研究課題ステータス	完了 (2003年度)
配分額 *注記	2,100千円 (直接経費: 2,100千円) 2003年度: 700千円 (直接経費: 700千円) 2002年度: 1,400千円 (直接経費: 1,400千円)
キーワード	コーパス / インターネット / 自然言語処理 / 情報抽出 / 自動要約 / 機械翻訳 / 複合語分析 / インターネットコーパス / 複合語処理 / 統計量
研究概要	インターネット上には情報が氾濫している。ネット上の情報(テキスト情報)は、統計や例示に基づく自然言語処理をするとき、有用な言語資となり得る。本研究は、機械翻訳支援、自動要約、情報抽出などの言語情報処理に必要な文や単語の意味分析、構造分析にネット上のテキスト情報を利用する実験を行い、その有用性の検証を試みたものである。ここでは、機械翻訳の支援システムをつくる研究に、ネット上にある類例(文)を検索して使い、より自然な翻訳文をつくるための実験を行った。一方、情報検索、自動要約などで不可欠となる複合語の単位語(構成要素)への分割とそのその構造分析に、統計的に単語の結合度を測って要素間の単位語の依存関係を明らかにするために、インターネットコーパスを使った。いずれの研究においても、インターネット上のテキストデータの有効性が認められた。言語の統計処理には常にデータの希薄性の問題がある。信頼性の高い処理結果を得るには、特定の言語現象が例外ではなく規則であることを証明する必要がある。我々の実験は、インターネット上にある"無限"のテキストデータの利用価値が高いことを証明したが、精度の高い言語分析をするうえで、インターネットコーパスにも問題があることからくると思われる難点が見受けられたからである。その点で、インターネットコーパスの利用するときには、ノイズとなるようなデータを利用しないようにする技術も必要である。

報告書

(3件)

2003 実績報告書研究成果報告書概要
2002 実績報告書

研究成果
(24件)

すべてその他

すべて文献書誌 (24件)

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Relations"J.of Quautitative Linguistics. 9. 1-17 (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Teiji Furugori, Lin Rihua, Takeshi Ito, Dongli Han: "Information Extraction and Summerization for Newspaper Articles on Sassho-Jiken"IEICE Transactions. E86-D. 1728-1735 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] 韓勅, 伊藤毅志, 古郡廷治: "要素間の依存関係に基づく複合語の構造分析"電子情報通信学会誌. J86-DII. 706-714 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "A deterministic method for structural analysis of compound words in Japanese"Proc.of 16th Paciffic Asia Conf.on Language, Information and Computation. 79-91 (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Rewritins Japanese Compound nouns into expressions usable effectively in machine translation System"Proc.of 2002 IEEE Int'l Conf.on System Man and Cybernatics. (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Sawa Takakura, Takeshi Ito, Teiji Furugori: "Trans Aid : a writer's aid system for translating Japanese into English"Proc.of 2002 IEEE Int'l Conf.on System Man and Cybernatics. (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Sawa Takakura, Dongli Han, Teiji Furugori: "Proc.of Winter Int'l Symp.on Info and Comm Technology"An experiment for determining semantic, relations between main and sobordinate clauses in Complex sentence seateuces. (2004)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "A deterministic method for structural analysis of compound words in Japanese"Proc. of the 16th Pacific Asia Conference Language, Information and Computation. 79-91 (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Rewriting Japanese compound nouns into expressions usable effectively in machine translation system"Proc. of 2002 IEEE International Conference on System, Man and Cybernetics. (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Sawa Takakura, Takeshi Ito, Teiji Furugori: "TransAid : a writer's aid system for translating Japanese into English"Proc. of 2002 IEEE International Conference on System, Man and Cybernetics. (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Sawa Takakura, Dongli Han, Teiji Furugori: "An experiment for determining semantic relations between main and subordinate clauses in complex sentences"Proc. of Winter International Symposium on Information and Communication Technolog. (2004)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Releations"Journal of Quantitative Linguistics. Vol.9, No.1. 1-17 (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Teiji Furugori, Lin Rihua, Takashi Ito, Dongli Han: "Information Extraction and Summarization for Newspaper Articles on Sassho-Jiken"IEICE Trans.. Vol.E86-D, No.9. 1728-35 (2003)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Releations"Journal of Quantitative Linguistics. Vol.9, No.1. 1-17 (2002)
- 関連する報告書
  2003 実績報告書
[文献書誌] Teiji Furugori, Lin Rihua, Takeshi Ito, Dongli Han: "Information Extraction and Summarization for Newspaper Articles on Sassho-Jiken"IEICE Trans.. Vol..E86-D, No.9. 1728-1735 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 韓東力, 伊藤毅志, 古郡廷治: "要素間の依存関係に基づく複合語の構造分析"電子情報通信学会論文誌. Vol.J86-D-(監), No.5. 706-714 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "A deterministic method for structural analysis of compound words in Japanese"Proc.of the 16th Pacific Asia Conference on Language, Information and Computation. 79-91 (2002)
- 関連する報告書
  2003 実績報告書
[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Rewriting Japanese compound nouns into expressions useable effectively in machine translation system"Proc.of 2002 IEEE International Conference on System, Man and Cybernetics. (CD-ROM)WA2E4. 6 (2002)
- 関連する報告書
  2003 実績報告書
[文献書誌] Sawa Takakura, Takeshi Ito, Teiji Furugori: "TransAid : a writer's aid system for translating Japanese into English"Proc.of 2002 IEEE International Conference on System, Man and Cybernetics. (CD-ROM)WA2E3. 6 (2002)
- 関連する報告書
  2003 実績報告書
[文献書誌] Sawa Takakura, Dongli Han, Teiji Furugori: "An experiment for determining semantic relations between main and subordinate clauses in complex sentences"Proc.of Winter International Symposium on Information and Comunication Technolog. (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] Han, D., Ito, T., Furugori, T.: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Relations"Journal of Quantitative Linguistics. Vol.9,No.1. 1-17 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] Han, D., Ito, T., Furugori, T.: "A Deterministic Method for Structural Analysis of Compound Words in Japanese"The 16th Pacific-Asia Conference on Language, Information, and Computation. 79-91 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] Peng, Q., Wu, H., Furugori, T.: "A Method for Similarity-based Lexical Disambiguation"Journal of Natural Language Processing. Vol.9,No.2. (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] Han, D., Ito, T., Furugori, T.: "Rewriting Japanese Compound Nouns into Expressions Usable Effectively in Machine Translation Systems"IEEE SMC '02. (2002)
- 関連する報告書
  2002 実績報告書

自然言語処理におけるインターネットコーパスの応用に関する研究

研究代表者

古郡 廷治 電気通信大学, 電気通信学部, 教授 (80114932)

2,100千円 (直接経費: 2,100千円)

報告書

研究成果

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Relations"J.of Quautitative Linguistics. 9. 1-17 (2002)

説明

関連する報告書

[文献書誌] Teiji Furugori, Lin Rihua, Takeshi Ito, Dongli Han: "Information Extraction and Summerization for Newspaper Articles on Sassho-Jiken"IEICE Transactions. E86-D. 1728-1735 (2003)

説明

関連する報告書

[文献書誌] 韓勅, 伊藤毅志, 古郡廷治: "要素間の依存関係に基づく複合語の構造分析"電子情報通信学会誌. J86-DII. 706-714 (2003)

説明

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "A deterministic method for structural analysis of compound words in Japanese"Proc.of 16th Paciffic Asia Conf.on Language, Information and Computation. 79-91 (2002)

説明

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Rewritins Japanese Compound nouns into expressions usable effectively in machine translation System"Proc.of 2002 IEEE Int'l Conf.on System Man and Cybernatics. (2002)

説明

関連する報告書

[文献書誌] Sawa Takakura, Takeshi Ito, Teiji Furugori: "Trans Aid : a writer's aid system for translating Japanese into English"Proc.of 2002 IEEE Int'l Conf.on System Man and Cybernatics. (2002)

説明

関連する報告書

[文献書誌] Sawa Takakura, Dongli Han, Teiji Furugori: "Proc.of Winter Int'l Symp.on Info and Comm Technology"An experiment for determining semantic, relations between main and sobordinate clauses in Complex sentence seateuces. (2004)

説明

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "A deterministic method for structural analysis of compound words in Japanese"Proc. of the 16th Pacific Asia Conference Language, Information and Computation. 79-91 (2002)

説明

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Rewriting Japanese compound nouns into expressions usable effectively in machine translation system"Proc. of 2002 IEEE International Conference on System, Man and Cybernetics. (2002)

説明

関連する報告書

[文献書誌] Sawa Takakura, Takeshi Ito, Teiji Furugori: "TransAid : a writer's aid system for translating Japanese into English"Proc. of 2002 IEEE International Conference on System, Man and Cybernetics. (2002)

説明

関連する報告書

[文献書誌] Sawa Takakura, Dongli Han, Teiji Furugori: "An experiment for determining semantic relations between main and subordinate clauses in complex sentences"Proc. of Winter International Symposium on Information and Communication Technolog. (2004)

説明

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Releations"Journal of Quantitative Linguistics. Vol.9, No.1. 1-17 (2002)

説明

関連する報告書

[文献書誌] Teiji Furugori, Lin Rihua, Takashi Ito, Dongli Han: "Information Extraction and Summarization for Newspaper Articles on Sassho-Jiken"IEICE Trans.. Vol.E86-D, No.9. 1728-35 (2003)

説明

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Releations"Journal of Quantitative Linguistics. Vol.9, No.1. 1-17 (2002)

関連する報告書

[文献書誌] Teiji Furugori, Lin Rihua, Takeshi Ito, Dongli Han: "Information Extraction and Summarization for Newspaper Articles on Sassho-Jiken"IEICE Trans.. Vol..E86-D, No.9. 1728-1735 (2003)

関連する報告書

[文献書誌] 韓東力, 伊藤毅志, 古郡廷治: "要素間の依存関係に基づく複合語の構造分析"電子情報通信学会論文誌. Vol.J86-D-(監), No.5. 706-714 (2003)

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "A deterministic method for structural analysis of compound words in Japanese"Proc.of the 16th Pacific Asia Conference on Language, Information and Computation. 79-91 (2002)

関連する報告書

[文献書誌] Dongli Han, Takeshi Ito, Teiji Furugori: "Rewriting Japanese compound nouns into expressions useable effectively in machine translation system"Proc.of 2002 IEEE International Conference on System, Man and Cybernetics. (CD-ROM)WA2E4. 6 (2002)

関連する報告書

[文献書誌] Sawa Takakura, Takeshi Ito, Teiji Furugori: "TransAid : a writer's aid system for translating Japanese into English"Proc.of 2002 IEEE International Conference on System, Man and Cybernetics. (CD-ROM)WA2E3. 6 (2002)

関連する報告書

[文献書誌] Sawa Takakura, Dongli Han, Teiji Furugori: "An experiment for determining semantic relations between main and subordinate clauses in complex sentences"Proc.of Winter International Symposium on Information and Comunication Technolog. (2004)

関連する報告書

[文献書誌] Han, D., Ito, T., Furugori, T.: "Structural Analysis of Compound Words in Japanese Using Semantic Dependency Relations"Journal of Quantitative Linguistics. Vol.9,No.1. 1-17 (2002)

関連する報告書

[文献書誌] Han, D., Ito, T., Furugori, T.: "A Deterministic Method for Structural Analysis of Compound Words in Japanese"The 16th Pacific-Asia Conference on Language, Information, and Computation. 79-91 (2002)

関連する報告書

[文献書誌] Peng, Q., Wu, H., Furugori, T.: "A Method for Similarity-based Lexical Disambiguation"Journal of Natural Language Processing. Vol.9,No.2. (2002)

関連する報告書

[文献書誌] Han, D., Ito, T., Furugori, T.: "Rewriting Japanese Compound Nouns into Expressions Usable Effectively in Machine Translation Systems"IEEE SMC '02. (2002)

関連する報告書

古郡廷治電気通信大学, 電気通信学部, 教授 (80114932)