• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Annual Research Report

平易な日本語表現への工学的アプローチ

Research Project

Project/Area Number 24300052
Research InstitutionNagoya University

Principal Investigator

佐藤 理史  名古屋大学, 工学(系)研究科(研究院), 教授 (30205918)

Project Period (FY) 2012-04-01 – 2016-03-31
Keywords自然言語処理 / 節境界 / 辞書定義文 / 大学入試問題 / 文の平均像
Outline of Annual Research Achievements

本年度は、主に、以下の項目で成果を得た。
1.文節・節境界検出プログラムの改良:節境界検出システムRainbowを改良した。Rainbowでは、節境界は必ず文節境界であるという点に着目し、文中の文節境界を認定したのち、それらが節末境界となるかどうかを判定するという2段階判定方式を採用した。このような方式を採用することにより、節末境界認定ルールが簡潔に記述することが可能となった。Rainbowは、節末境界認定と同時に、節タイプを57種類のいずれかに分類する。
2.日本語文の平均像の産出:現代日本語書き言葉均衡コーパスの一部を用いて、日本語文の平均像を産出した。具体的には、文に対して6 グループ17 種類の特徴量を定義し、約53.5万文に対して、それぞれの特徴量を求めた後、各特徴量の統計値(最頻値、平均値、中央値)を算出した。各特徴量の中央値を文の平均像として採用し、この平均像を最も良く体現した文を決定する方法を定め、実際にそのような文を同定した。
3.テキスト含意認識と大学入試問題への応用:大学入試問題の「国語」および「歴史」を対象に、現在のテキスト含意認識技術で、問題がどれくらい解けるかを試みた。「国語」評論の読解問題では、節境界解析を導入することにより、センター試験の過去問に対しては、これまでの結果を上回る結果を得た。「歴史」の問題の大半は、テキスト含意認識の枠組みで解答可能であり、約半分が正しく解けることがわかった。
4.辞書定義文型の試作と設計:日本語の語を定義するためのfull-sentence definitionの設計を進め、副詞、形容詞、動詞に対して、記述形式を定めた。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

予定していた基本語彙表の編纂が難航し、完了しなかった。意味区分の導入については、抜本的に見直す必要がある。
日本語の辞書定義文型の設計については、名詞に対する設計が完了しなかった。

Strategy for Future Research Activity

辞書定義文型の設計については、名詞に対する設計を行い、主要品詞(動詞、形容詞、副詞、名詞)に対する設計を完了し、マニュアル化する予定である。基本語彙表の編纂に関しては、次の科研でも研究を継続する予定である。

Causes of Carryover

日本語の辞書定義文型の試作と設計を進めてきたが、コーパスの調査等の作業量が予想していたよりも多く、ジャーナル論文執筆と定義文作成マニュアルの完成に至らなかった。このため、予定していた論文投稿費やマニュアル印刷費に未使用金額が生じた。

Expenditure Plan for Carryover Budget

研究支援者を2か月雇用して、日本語の辞書定義文型の作成のためのコーパス調査を引き続き実施し、辞書定義文記述マニュアルの作成を目指す。未使用額は、そのための費用に充てる。

  • Research Products

    (12 results)

All 2015 2014

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results,  Acknowledgement Compliant: 1 results) Presentation (10 results)

  • [Journal Article] 表層類似度に基づく センター試験『国語』現代文傍線部問題ソルバー2014

    • Author(s)
      佐藤 理史, 加納 隼人, 西村 翔平, 駒谷 和範
    • Journal Title

      自然言語処理

      Volume: 21 Pages: 465-483

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] 表層類似度に基づく日本語テキスト含意認識2014

    • Author(s)
      服部 昇平, 佐藤 理史, 駒谷 和範
    • Journal Title

      人工知能学会論文誌

      Volume: 29 Pages: 416-426

    • Peer Reviewed / Open Access
  • [Presentation] 『ロボットは東大に入れるか』プロジェクト 代ゼミセンター模試タスクにおけるエラーの分析2015

    • Author(s)
      松崎拓也, 横野光, 宮尾祐介, 川添愛, 狩野芳伸, 加納隼人, 佐藤理史, 東中竜一郎, 杉山弘晃 , 磯崎秀樹 , 菊井玄一郎 , 堂坂浩二, 平博順, 南泰浩
    • Organizer
      言語処理学会第21回年次大会ワークショップ
    • Place of Presentation
      京都大学(京都府・京都市)
    • Year and Date
      2015-03-21
  • [Presentation] RITE-VALタスクを対象とした表層類似度に基づくテキストの真偽判定2015

    • Author(s)
      服部昇平,佐藤理史,松崎拓也
    • Organizer
      情報処理学会第77回全国大会
    • Place of Presentation
      京都大学(京都府・京都市)
    • Year and Date
      2015-03-19
  • [Presentation] 数学確率文章題の自動解答システムの開発2015

    • Author(s)
      神谷翼, 松崎拓也, 佐藤理史
    • Organizer
      言語処理学会第21回年次大会
    • Place of Presentation
      京都大学(京都府・京都市)
    • Year and Date
      2015-03-17
  • [Presentation] 新しい日本語辞書定義文型の策定に向けて(第二報)2015

    • Author(s)
      佐藤 理史, 夏目 和子
    • Organizer
      第7回コーパス日本語学ワークショップ
    • Place of Presentation
      国立国語研究所(東京都・立川市)
    • Year and Date
      2015-03-10
  • [Presentation] 節境界検出を用いたセンター試験『国語』評論傍線部問題ソルバー2015

    • Author(s)
      加納 隼人,佐藤 理史,松崎 拓也
    • Organizer
      情報処理学会自然言語研究会
    • Place of Presentation
      九州大学(福岡県・福岡市)
    • Year and Date
      2015-01-20
  • [Presentation] A Surface-Similarity Based Two-Step Classifier for RITE-VAL2014

    • Author(s)
      Shohei Hattori and Satoshi Sato
    • Organizer
      NTCIR-11
    • Place of Presentation
      国立情報学研究所(東京都・千代田区)
    • Year and Date
      2014-12-11
  • [Presentation] 日本語節境界検出プログラム Rainbow の作成と評価2014

    • Author(s)
      加納 隼人,佐藤 理史
    • Organizer
      第13回情報科学技術フォーラム(FIT2014)
    • Place of Presentation
      筑波大学(茨城県・つくば市)
    • Year and Date
      2014-09-04
  • [Presentation] 日本語の文の平均像を体現した文を探す (1) 文の特徴量の抽出2014

    • Author(s)
      刀山 将大, 佐藤 理史, 近藤 秀, 吉田 達平
    • Organizer
      第13回情報科学技術フォーラム(FIT2014)
    • Place of Presentation
      筑波大学(茨城県・つくば市)
    • Year and Date
      2014-09-04
  • [Presentation] 日本語の文の平均像を体現した文を探す (2) 平均からの距離2014

    • Author(s)
      近藤 秀, 佐藤 理史, 刀山 将大, 加納 隼人
    • Organizer
      第13回情報科学技術フォーラム(FIT2014)
    • Place of Presentation
      筑波大学(茨城県・つくば市)
    • Year and Date
      2014-09-04
  • [Presentation] Text Readability and Word Distribution in Japanese2014

    • Author(s)
      Satoshi Sato
    • Organizer
      the Ninth International Conference on Language Resources and Evaluation (LREC'14)
    • Place of Presentation
      レイキャビク(アイスランド)
    • Year and Date
      2014-05-29

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi