• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

平易な日本語表現への工学的アプローチ

Research Project

Project/Area Number 24300052
Research Category

Grant-in-Aid for Scientific Research (B)

Research InstitutionNagoya University

Principal Investigator

佐藤 理史  名古屋大学, 工学研究科, 教授 (30205918)

Project Period (FY) 2012-04-01 – 2015-03-31
Keywords自然言語処理 / 基本語彙表 / テキストの難易度 / 機能表現 / 助詞・助動詞 / 見出しの自動付与
Research Abstract

本年度の成果は、以下のとおり。
1.難易度データの作成と、文の難易度の基礎検討
テキストの難易度を推定するツールobi2において、『現代日本語書き言葉均衡コーパス(BCCWJ)』の難易度分布に基づいて、9段階の難易度を推定するモデルobi2/B9を再構築し、BCCWJのリリース版の全てのサンプルに、9段階の難易度データを付与した。この成果は、今後の難易度研究の基盤となるものである。さらに、このデータを用いて、文の難易度を測るための指標の基礎検討を行なった。
2.基本語彙表の改良
意味カテゴリ別の区分が可能な基本語彙表の基本設計を行ない、以前に作成した基本語彙表JC2の2500語に対して、意味ラベル(講談社『類語辞典』のカテゴリーコード)の付与作業を進めた。付与した意味ラベルに基づき、意味カテゴリ別に、収録語の再検討を行なった。(現在も継続中である。)
3.機能表現の整理と文節パターンの列挙
文末機能表現(いわゆる助動詞・終助詞)の整理を進め、文末機能表現シソーラスの第1版を編纂した。このシソーラスを用いて、文機能表現を正規化するシステムを実装した。さらに、これらと平行して、名詞を中心とした文節の末尾の機能表現(いわゆる格助詞・係助詞)の連接パターンを分析・整理し、主要な文節パターンを列挙した。これらは、これまでの日本語学の欠落を埋める成果である。
4.その他
それぞれの段落に、見出しを自動的に付与する方法を検討し、システムを試作した。また、文字bigramに基づき、テキストの著者の生年を推定する方法を検討した。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

各種作業の補助を担当する技術補佐員の雇用開始が、予定より数ヶ月遅れたため、基本語彙表の編纂作業が、若干遅れ気味である。

Strategy for Future Research Activity

次年度は、技術補佐員の勤務を週2日から週3日に増やし、基本語彙表の編纂作業のスピードアップを図る。難易度推定については、英語をはじめとした他言語の研究成果(PITR2012等で報告されている)を参考にして、多くの可能性を探る。

Expenditure Plans for the Next FY Research Funding

技術補佐員の雇用開始が遅れたため、残金が生じた。この分は、次年度以降の週当りの勤務時間の増加分(2日から3日へ増加)に充当する予定である。

  • Research Products

    (7 results)

All 2013 2012

All Presentation (7 results)

  • [Presentation] 格助詞・副助詞類の連続出現パターン2013

    • Author(s)
      佐藤理史
    • Organizer
      第3回コーパス日本語学ワークショップ
    • Place of Presentation
      立川市(東京都)
    • Year and Date
      2013-03-28
  • [Presentation] エッセイコーパスを用いた著者の生年の推定2013

    • Author(s)
      岩崎裕也, 佐藤理史, 駒谷和範
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋市(愛知県)
    • Year and Date
      2013-03-15
  • [Presentation] 難しい日本語文の自動検出のための基礎調査2013

    • Author(s)
      伊藤美咲姫, 佐藤理史, 駒谷和範
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋市(愛知県)
    • Year and Date
      2013-03-15
  • [Presentation] 段落見出しの自動生成に向けて2013

    • Author(s)
      川口人士, 佐藤理史, 駒谷和範
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋市(愛知県)
    • Year and Date
      2013-03-14
  • [Presentation] 文末機能表現シソーラスの網羅性の検証2013

    • Author(s)
      松木久幸, 佐藤理史, 駒谷和範
    • Organizer
      情報処理学会第75回全国大会
    • Place of Presentation
      仙台市(宮城県)
    • Year and Date
      2013-03-06
  • [Presentation] 現代日本語書き言葉均衡コーパスに対する難易度付与2012

    • Author(s)
      佐藤理史
    • Organizer
      第2回コーパス日本語学ワークショップ
    • Place of Presentation
      立川市(東京都)
    • Year and Date
      2012-09-07
  • [Presentation] 文末機能表現シソーラスと述語正規化システム2012

    • Author(s)
      松木久幸, 佐藤理史, 駒谷和範
    • Organizer
      第2回コーパス日本語学ワークショップ
    • Place of Presentation
      立川市(東京都)
    • Year and Date
      2012-09-07

URL: 

Published: 2014-07-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi