2001 Fiscal Year Annual Research Report
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
Project/Area Number |
12780282
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
宇津呂 武仁 豊橋技術科学大学, 工学部, 講師 (90263433)
|
Keywords | 自然言語処理 / 意味辞書 / コーパス / 語彙知識獲得 / 自然言語理解 / 固有表現 / 名詞の意味表現 / 意味的曖昧性解消 |
Research Abstract |
本研究では,実用的規模の言語テキストに対して,これまでよりも深いレベルの意味理解を高性能に行うことを目的として,名詞の意味・用法をより深いレベルで記述した意味辞書を,大規模テキストデータから半自動的に構築する手法の研究を行った.本年度は,大規模な名詞意味辞書の存在が本質的に必須となる言語理解の各過程において,名詞意味辞書がどの程度有効であるかを評価・検証し,さらに言語理解の精度が最適化されるように,名詞意味辞書の記述の一般化の度合を柔軟に調整する手法の研究を行なった.本年度の研究項目は次の2点である. 1.テキストの語彙的結束性に基づく語の意味的曖昧性の解消の過程において,名詞意味辞書の有効性を評価・検証した. 2.照応・指示・省略などの文脈理解の各過程において,名詞意味辞書の有効性を評価・検証した. まず,第1点については,統計的手法により学習された意味的曖昧性解消規則を適用する過程において,名詞意味辞書の有効性を評価・検証した.従来,統計的手法による意味的曖昧性解消の研究においては,テキスト中の単語など表層的手がかりのみに基づいて意味的曖昧性を解消していたが,本研究では,意味的曖昧性解消の手がかりとして名詞意味辞書の記述を利用することにより,曖昧性解消の性能がどの程度向上するかを評価・検証した. 第2点については,複数の文からなるテキストについて,テキスト中の名詞の意味記述を名詞意味辞書から検索し,これらをネットワーク状に連結することにより,まず,テキスト全体の語彙的結束性を表現した.そして,語彙的結束性に基づく語彙的制約と談話構造上の制約を統合的に考慮することにより,照応・指示・省略の参照先を決定する文脈理解モデルを構築し,その性能を評価した.
|
Research Products
(13 results)
-
[Publications] Takehito Utsuro: "Analyzing Dependencies of Japanese Subordinate Clauses based on Statistics of Scope Embedding Preference"Proceedings of the 1st Conference of the North American Chapter of the Association for Computational Linguistics. 110-117 (2000)
-
[Publications] Takehito Utsuro: "Learning Preference of Dependency between Japanese Subordinate Clauses and Its Evaluation in Parsing"Proceedings of the 2nd International Conference on Language Resources and Evaluation. 583-590 (2000)
-
[Publications] Takehito Utsuro: "Minimally Supervised Japanese Named Entity Recognition: Resources and Evaluation"Proceedings of the 2nd International Conference on Language Resources and Evaluation. 1229-1236 (2000)
-
[Publications] 宇津呂 武仁: "言語コーパスをより有効に使うために"情報処理. 41・7. 787-792 (2000)
-
[Publications] Manabu Sassano: "Named Entity Chunking Techniques in Supervised Learning for Japanese Named Entity Recognition"Proceedings of the 18th International Conference on Computational Linguistics. 705-711 (2000)
-
[Publications] 颯々野 学: "統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価"情報処理学会研究報告. 2000-NL-139. 1-8 (2000)
-
[Publications] 宇津呂 武仁: "ブートストラップによる低人手コスト日本語固有表現抽出"情報処理学会研究報告. 2000-NL-139. 9-16 (2000)
-
[Publications] 黒川 和也: "コーパスを利用した日本語機能表現学習教材作成支援"言語処理学会第7回年次大会論文集. 367-370 (2001)
-
[Publications] 宇津呂 武仁: "正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合"情報処理学会研究報告. 2001-NL-144. 31-38 (2001)
-
[Publications] 宇津呂 武仁: "正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合"自然言語処理(言語処理学会論文誌). 9・1. 65-100 (2002)
-
[Publications] 堀内貴司: "翻訳知識獲得のための言語横断関連報道記事検索"言語処理学会第8回年次大会論文集. (2002)
-
[Publications] 黒川 和也: "コーパスおよび機能表現の分類体系を利用した日本語機能表現学習教材作成支援"言語処理学会第8回年次大会論文集. (2002)
-
[Publications] Robert Dale: "Handbook of Natural Language Processing"Marcel Dekker Inc.. 943 (2000)