• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

係り受けや照応・省略などの高次言語情報を用いた確率的言語モデル

Research Project

Project/Area Number 20680008
Research InstitutionKyoto University

Principal Investigator

森 信介  Kyoto University, 学術情報メディアセンター, 准教授 (90456773)

Keywords確率的言語モデル / 係り受け / 照応・省略 / 認知科学 / 音声認識
Research Abstract

平成21年度では、前年度に単語境界情報と単語間の係り受け情報を付与した辞書の例文や新聞記事の文に仮名漢字変換のや読み推定を目的として読みを付与し、分析・実験のためのコーパスを作成した。次に、確率的言語モデルを用いる読み推定や仮名漢字変換システムを構築した。
(1) 読み情報などの部分的付与
前年度に作成した単語分割済みコーパスの各単語に読みを付与した。合計の文数は、26、418であり、文字数は725、354である。また、1、000文の医療テキストに対して単語境界情報や読みを付与し、分野適応の実験ができるようにした。また、専門用語辞書の見出し語や専門分野の文に読みや単語境界の情報を部分的に付与することも行った。これにより、部分的なアノテーションからの学習の実験が行なえるようにした。
(2) 部分的なアノテーションからの学習する自動単語分割器や読み推定器の学習
実用的な自然言語処理を考えると、分野適応が非常に重要である。これを速やかに実現するために部分的なアノテーションからの学習を提案した。この提案に沿って、単語境界が文の一部にのみ付与されたコーパスや一部の単語にのみ読みが付与されたコーパスから自動単語分割器や読み推定器を提案し実装した。さらに、独自に準備した専門分野のテキストに対する言語処理において精度向上を確認した。これらは、フリーソフトウェア-として公開している。

  • Research Products

    (9 results)

All 2010 2009 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (5 results) Book (1 results) Remarks (1 results)

  • [Journal Article] 日本語単語分割の分野適応のための部分的アノテーションを用いた条件付確率場の学習2009

    • Author(s)
      坪井祐太, 森信介, 鹿島久嗣, 小田裕樹, 松本裕治
    • Journal Title

      情報処理学会論文誌 50

      Pages: 1622-1635

    • Peer Reviewed
  • [Journal Article] 擬似確率的単語分割コーパスによる言語モデルの改良2009

    • Author(s)
      森信介, 小田裕樹
    • Journal Title

      自然言語処理 16

      Pages: 7-21

    • Peer Reviewed
  • [Presentation] 点推定と能動学習を用いた自動単語分割器の分野適応2010

    • Author(s)
      Neubig Graham, 中田陽介, 森信介
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京
    • Year and Date
      2010-03-11
  • [Presentation] 仮名漢字変換ログの活用による言語処理精度の自動向上2010

    • Author(s)
      森信介, Neubig Graham
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京
    • Year and Date
      2010-03-09
  • [Presentation] 利用過程で得られる言語情報を活用する音声言語処理システム2009

    • Author(s)
      森信介, 前田浩邦
    • Organizer
      NLP若手の会 第4回シンポジウム
    • Place of Presentation
      京都
    • Year and Date
      2009-10-01
  • [Presentation] A WFST-based Log-linear Framework for Speaking-style Transformation2009

    • Author(s)
      Graham Neubig, Shinsuke MORI, Tatsuya Kawahara
    • Organizer
      InterSpeech
    • Place of Presentation
      Brighton, UK
    • Year and Date
      2009-09-06
  • [Presentation] Automatic Word Segmentation using Three Types of Dictionaries2009

    • Author(s)
      Shinsuke MORI, Hiroki ODA
    • Organizer
      PACLING
    • Place of Presentation
      札幌
    • Year and Date
      2009-09-01
  • [Book] 言語処理学事典2009

    • Author(s)
      森信介, 他多数
    • Total Pages
      915
    • Publisher
      共立出版株式会社
  • [Remarks]

    • URL

      http://plata.ar.media.kyoto-u.ac.jp/mori/research/

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi