タグ付きコーパスとタグなしコーパスの相補的利用による言語学習に関する研究

研究課題

研究課題/領域番号	13680429
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	茨城大学
研究代表者	新納浩幸茨城大学, 工学部, 助教授 (10250987)
研究期間 (年度)	2001 – 2002
研究課題ステータス	完了 (2002年度)
配分額 *注記	2,500千円 (直接経費: 2,500千円) 2002年度: 1,200千円 (直接経費: 1,200千円) 2001年度: 1,300千円 (直接経費: 1,300千円)
キーワード	教師なし学習 / Co-training / EMアルゴリズム / 機械学習 / 語義判別問題 / SENSEVAL-2 / ファジィクラスタリング
研究概要	自然言語処理では個々の問題を分類問題として定式化し,帰納学習の手法により解決するというアプローチが大きな成功をおさめている.しかしそこには帰納学習で必要とされるタグ付きの訓練データを構築するコストが高いという問題がある.本研究の目的,この問題に対処するために,タグなしコーパスを併用することである. 本研究は教師なし学習の一種である.教師なし学習は近年複数観点を利用した手法が主流である.特にBlumらによるCo-trainingとNigamらによるEMアルゴリズムを利用した手法が主流である.これらの手法はともに文書分類を対象に提案されているので,自然言語処理の中心課題である語義判別問題に応用できるかどうかは明らかではない. 昨年度は主にCo-trainingの手法を検討した.特にCo-trainingを適用する際にネックとなる素性の独立性を緩和する手法を提案した.本年度,この成果を国際会議で発表した. また本年度は,EMアルゴリズムの手法に焦点を当てた.日本語SENSEVAL2の辞書タスクを用いて,提案手法の評価を行った.まずNigamらの手法を語義判別問題に応用できることを実装して示した.この結果は論文誌に採録された.そして,その際に単純に精度が向上しない問題もあることを示した.その解決手法として交差検定とアドホックな規則を用いる手法を提案した.提案した手法を用いることで,現在公になっている辞書タスクの最高正解率を実現することができた.この成果は研究会で発表し,国際会議での採録も決定した.日本語論文誌へも投稿し,現在査読中である. またEMアルゴリズムとクラスタリングの関係を調査し,ファジィクラスタリングからの教師なし学習も同時に検討した.この成果は研究会と3月の言語処理学会年次大会で発表した.

報告書

(3件)

2002 実績報告書研究成果報告書概要
2001 実績報告書

研究成果
(23件)

すべてその他

すべて文献書誌 (23件)

[文献書誌] H.Shinnou: "Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features"LREC-02. 4. 1380-1384 (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] 新納浩幸, 佐々木稔: "EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習"情報処理学会自然言語処理研究会. 152-8. 51-58 (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] 新納浩幸, 佐々木稔: "情報検索手法を利用した語義判別問題の高速解法"情報処理学会自然言語処理研究会. 152-9. 57-62 (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] 高橋篤史, 新納浩幸: "ファジィクラスタリングを用いた語義判別規則の教師なし学習"言語処理学会第9回年次大会. 306-309 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] 新納浩幸: "EMアルゴリズムを用いた教師なし学習の日本語翻訳タスクへの適用"自然言語処理. 10. 61-73 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] H.Shinnou, M.Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"Seventh Conference on Natural Language Learning. 41-48 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Hiroyuki Shinnou: "Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features"Proc. LREC-02. 1380-1384 (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Hiroyuki Shinnou and Minoru Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"NL SIG notes of IPSJ. NL-152-8. 51-58 (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Hiroyuki Shinuou and Minoru Sasaki: "Fast method of word sense disambiguation using information retrieval technique"NL SIG notes of IPSJ. NL-152-9. 57-62 (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Atsushi Takahashi and Hiroyuki Shinnou: "Unsupervised learning of word sense disambiguation rules by Fuzzy clustering"Proc. of 9th Annual Meeting of the Association for NLP. 306-309 (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Hiroyuki Shinnou: "Application of unsupervised learning using EM alogorthm to Japanese Translation Task"Journal of Natural Language Processing. 10, No. 3. 61-73 (2003)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Hiroyuki Shinnou and Miuoru Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"7th Conference on Natural Language Learning. 41-48 (2003)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2002 研究成果報告書概要
[文献書誌] Hiroyuki Shinnou: "Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features"LREC-02. 4. 1380-1384 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 新納浩幸, 佐々木稔: "EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習"情報処理学会自然言語処理研究会. 152-8. 51-58 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 新納浩幸, 佐々木稔: "情報検索手法を利用した語義判別問題の高速解法"情報処理学会自然言語処理研究会. 152-9. 57-62 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 高橋篤史, 新納浩幸: "ファジイクラスタリングを用いた語義判別規則の教師なし学習"言語処理学会第9回年次大会. 306-309 (2003)
- 関連する報告書
  2002 実績報告書
[文献書誌] 新納浩幸: "EMアルゴリズムを用いた教師なし学習の日本語翻訳タスクへの適用"自然言語処理. 10(発表予定). (2003)
- 関連する報告書
  2002 実績報告書
[文献書誌] Hiroyuki Shinnnou, Minoru Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"Seventh Conference on Natural Language Learning. (発表予定). (2003)
- 関連する報告書
  2002 実績報告書
[文献書誌] 新納浩幸: "日本語形態素解析の分類問題への変換とその解法"情報処理学会論文誌. 42-9. 2221-2228 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 新納浩幸: "決定リストを弱学習器としたアダブーストによる日本語単語分割"自然言語処理. 8-2. 3-18 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 新納浩幸: "SENSEVAL2日本語翻訳タスクに向けて作成した語義判別学習システムIbaraki"電子情報通信学会言語とコミュニケーション研究会. NLC-. 25-30 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 新納浩幸: "素性間の共起性を検査するCo-trainingによる語義判別規則の学習"情報処理学会自然言語処理研究会. 145-5. 29-36 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] Hiroyuki Shinnou: "Detection of errors in training data by using a decision list and Adaboost"IJCAI-2001 workshop"Text Learning:Beyond Supervision". 61-65 (2001)
- 関連する報告書
  2001 実績報告書

タグ付きコーパスとタグなしコーパスの相補的利用による言語学習に関する研究

研究代表者

新納 浩幸 茨城大学, 工学部, 助教授 (10250987)

2,500千円 (直接経費: 2,500千円)

報告書

研究成果

[文献書誌] H.Shinnou: "Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features"LREC-02. 4. 1380-1384 (2002)

説明

関連する報告書

[文献書誌] 新納浩幸, 佐々木稔: "EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習"情報処理学会自然言語処理研究会. 152-8. 51-58 (2002)

説明

関連する報告書

[文献書誌] 新納浩幸, 佐々木稔: "情報検索手法を利用した語義判別問題の高速解法"情報処理学会自然言語処理研究会. 152-9. 57-62 (2002)

説明

関連する報告書

[文献書誌] 高橋篤史, 新納浩幸: "ファジィクラスタリングを用いた語義判別規則の教師なし学習"言語処理学会第9回年次大会. 306-309 (2003)

説明

関連する報告書

[文献書誌] 新納浩幸: "EMアルゴリズムを用いた教師なし学習の日本語翻訳タスクへの適用"自然言語処理. 10. 61-73 (2003)

説明

関連する報告書

[文献書誌] H.Shinnou, M.Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"Seventh Conference on Natural Language Learning. 41-48 (2003)

説明

関連する報告書

[文献書誌] Hiroyuki Shinnou: "Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features"Proc. LREC-02. 1380-1384 (2002)

説明

関連する報告書

[文献書誌] Hiroyuki Shinnou and Minoru Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"NL SIG notes of IPSJ. NL-152-8. 51-58 (2002)

説明

関連する報告書

[文献書誌] Hiroyuki Shinuou and Minoru Sasaki: "Fast method of word sense disambiguation using information retrieval technique"NL SIG notes of IPSJ. NL-152-9. 57-62 (2002)

説明

関連する報告書

[文献書誌] Atsushi Takahashi and Hiroyuki Shinnou: "Unsupervised learning of word sense disambiguation rules by Fuzzy clustering"Proc. of 9th Annual Meeting of the Association for NLP. 306-309 (2002)

説明

関連する報告書

[文献書誌] Hiroyuki Shinnou: "Application of unsupervised learning using EM alogorthm to Japanese Translation Task"Journal of Natural Language Processing. 10, No. 3. 61-73 (2003)

説明

関連する報告書

[文献書誌] Hiroyuki Shinnou and Miuoru Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"7th Conference on Natural Language Learning. 41-48 (2003)

説明

関連する報告書

[文献書誌] Hiroyuki Shinnou: "Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features"LREC-02. 4. 1380-1384 (2002)

関連する報告書

[文献書誌] 新納浩幸, 佐々木稔: "EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習"情報処理学会自然言語処理研究会. 152-8. 51-58 (2002)

関連する報告書

[文献書誌] 新納浩幸, 佐々木稔: "情報検索手法を利用した語義判別問題の高速解法"情報処理学会自然言語処理研究会. 152-9. 57-62 (2002)

関連する報告書

[文献書誌] 高橋篤史, 新納浩幸: "ファジイクラスタリングを用いた語義判別規則の教師なし学習"言語処理学会第9回年次大会. 306-309 (2003)

関連する報告書

[文献書誌] 新納浩幸: "EMアルゴリズムを用いた教師なし学習の日本語翻訳タスクへの適用"自然言語処理. 10(発表予定). (2003)

関連する報告書

[文献書誌] Hiroyuki Shinnnou, Minoru Sasaki: "Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm"Seventh Conference on Natural Language Learning. (発表予定). (2003)

関連する報告書

[文献書誌] 新納浩幸: "日本語形態素解析の分類問題への変換とその解法"情報処理学会論文誌. 42-9. 2221-2228 (2001)

関連する報告書

[文献書誌] 新納浩幸: "決定リストを弱学習器としたアダブーストによる日本語単語分割"自然言語処理. 8-2. 3-18 (2001)

関連する報告書

[文献書誌] 新納浩幸: "SENSEVAL2日本語翻訳タスクに向けて作成した語義判別学習システムIbaraki"電子情報通信学会言語とコミュニケーション研究会. NLC-. 25-30 (2001)

関連する報告書

[文献書誌] 新納浩幸: "素性間の共起性を検査するCo-trainingによる語義判別規則の学習"情報処理学会自然言語処理研究会. 145-5. 29-36 (2001)

関連する報告書

[文献書誌] Hiroyuki Shinnou: "Detection of errors in training data by using a decision list and Adaboost"IJCAI-2001 workshop"Text Learning:Beyond Supervision". 61-65 (2001)

関連する報告書

新納浩幸茨城大学, 工学部, 助教授 (10250987)