• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

短答式記述テストにおける実用的な自動採点システムの開発

Research Project

Project/Area Number 23650558
Research InstitutionThe National Center for University Entrance Examinations

Principal Investigator

石岡 恒憲  独立行政法人大学入試センター, 研究開発部, 教授 (80311166)

Co-Investigator(Kenkyū-buntansha) 長塚 豪己  首都大学東京, システムデザイン研究科, 助教 (30384738)
Project Period (FY) 2011-04-28 – 2014-03-31
Keywords自然言語処理 / 情報システム / 統計数学 / 人工知能
Research Abstract

1)アルゴリズムの検討 我々が取るアプローチは、解答した答えを事前に用意した正解と比較するものである。これは自然言語処理の分野で研究が進んでいる含意関係認識によって達成される。含意関係認識とはテキストAの内容がテキストBの内容を含んでいるかどうかを、膨大な言語集体(コーパス)と高度な構文解析(や意味解析)および情報検索技術を用いて、判断・認識する技術である。これを用いることにより、その含意の程度に応じて、短答式記述問題の自動採点が可能となる。このアルゴリズムについて、国立情報学研究所の新井紀子先生との研究グループと協調をとりながら、研究を進めることを開始した。2)マシン環境の整備LAN上でWebブラウザによってシステムが実行できるように、Webサーバーを設置した。3)Rによる言語処理ライブラリの一部作成Rでは自然言語を取り扱うためのパッケージLanguageRの他、日本語処理においても形態素解析RMeCab (Rで動作するMeCab)や構文解析RCaboCha (Rで動作するCaboCha)を利用することができる。またNグラムなどの計量言語学で用いられる各種統計量を計算するためのパッケージ群も同時に提供され、現在も精力的にバージョンアップが重ねられている。本システムでは、欠測値を補完する方法として集団学習の方法の一つであるRandom Forestsに着目し、教師データのみならず教師なしデータに対しても適用できるよう拡張する方法を考案した。またそのRプログラムを作成した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

概ね当初の予定通りに研究が進んでいる。研究代表者が2編の審査論文を通し掲載した。また共同研究者の長塚が5編の審査論文(うち3件はページが確定)を通し、掲載予定にある。

Strategy for Future Research Activity

1)システムの試作 平成23年度に得られた結果を基にシステムの試作を行う。2)アルゴリズムの検討 前年度に引き続きアルゴリズムの検討を行う。そこでは、形態素解析だけでなく、文章の係り受けのよさや文の明確性を正解性の評価とすることを考える。また本研究代表者は、さきに情報検索システムの性能を示す指標として、しばしば用いられてきた再現率と精度に関して、またその両方を併せ持ったF尺度やフォールアウトなどの指標が、統計学で長年使われてきた多くの関連度指標とどのような関係にあるかを定量的に評価する研究を行なった。これらの結果の活用も必要に応じて利用する。また同義語辞書の完備や、半教師データの利用についても検討を加える。

Expenditure Plans for the Next FY Research Funding

研究代表者は、研究成果の国際会議での発表2件を予定している。そのための参加登録料や、旅費が必要である。共同研究者の長塚も昨年同様、総計処理について、幾つかの審査論文の掲載を目指しており、そのための英文校閲費や学会発表旅費が必要である。また今年度より共同研究者にあらたなメンバーを加え、システムの評価を行う予定である。そのために、システムの専門家(人間)との比較が必要であり、専門家に依頼する小論文採点の謝金が必要である。昨年度からの繰り越しは、研究成果の国際会議での発表を昨年度に行わずに、今年度バリ(インドネシア)で開催されるThe 14th International Conference on Information Integration and Web-based Applications & Services (iiWAS2012)で発表することに変更したためである。これは本研究代表者がこの国際会議のプログラム委員を務めることに昨年度、急遽決まったことによる。

  • Research Products

    (8 results)

All 2012 2011

All Journal Article (7 results) (of which Peer Reviewed: 7 results) Presentation (1 results)

  • [Journal Article] Parameter and quantile estimation for the three-parameter lognormal distribution based on statistics invariant to unknown location2012

    • Author(s)
      Hideki Nagatsuka and N. Balakrishnan
    • Journal Title

      Journal of Statistical Computation and Simulation

      Volume: Vol.43 Pages: 1629-1647

    • DOI

      10.1080/00949655.2012.667410

    • Peer Reviewed
  • [Journal Article] A consistent parameter estimation in the three-parameter lognormal distribution2012

    • Author(s)
      Hideki Nagatsuka and N. Balakrishnan
    • Journal Title

      Journal of Statistical Planning and Inference, Elsevier

      Volume: Vol.142, Issue 7 Pages: 2071-2086

    • DOI

      10.1016/j.jspi.2012.01.019

    • Peer Reviewed
  • [Journal Article] Parameter and quantile estimation for the three-parameter gamma distribution based on statistics invariant to unknown location2012

    • Author(s)
      Hideki Nagatsuka and N. Balakrishnan
    • Journal Title

      Journal of Statistical Planning and Inference, Elsevier

      Volume: Vol.142, Issue 7 Pages: 2807-2102

    • DOI

      10.1016/j.jspi.2012.01.018

    • Peer Reviewed
  • [Journal Article] A consistent method of estimation for the parameters of the three-parameter inverse Gaussian distribution2012

    • Author(s)
      Hideki Nagatsuka and N. Balakrishnan
    • Journal Title

      Journal of Statistical Computation and Simulation

      Volume: 83 Pages: 1915-1931

    • DOI

      10.1080/00949655.2012.674130

    • Peer Reviewed
  • [Journal Article] Parameter estimation of multivariate distributions under order restrictions of the parameters: An extension of isotonic regression2012

    • Author(s)
      Hideki Nagatsuka, Megumi Uchino and Hisashi Yamamoto
    • Journal Title

      Quality Technology and Quantitative Management

      Volume: 未定 Pages: 未定

    • Peer Reviewed
  • [Journal Article] Ascertaining and graphically representing the logical structure of Japanese essays2011

    • Author(s)
      Tsunenori Ishioka
    • Journal Title

      International Journal of Continuing Engineering Education and Life-Long Learning (IJCEELL)

      Volume: Volume 21, Issue 4 Pages: 276-288

    • Peer Reviewed
  • [Journal Article] Random Forestを用いた欠測データの補完に基づく大学入試センター試験科目間得点差2011

    • Author(s)
      石岡恒憲
    • Journal Title

      応用統計学

      Volume: 40 (3) Pages: 193-209

    • Peer Reviewed
  • [Presentation] Random Forestによるコンテキスト情報の補完について2011

    • Author(s)
      石岡 恒憲
    • Organizer
      電子情報通信学会, 信学技報
    • Place of Presentation
      九州大学
    • Year and Date
      2011年11月21日

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi