2014 Fiscal Year Research-status Report
Project/Area Number |
26350357
|
Research Institution | The National Center for University Entrance Examinations |
Principal Investigator |
石岡 恒憲 独立行政法人大学入試センター, 研究開発部, 教授 (80311166)
|
Co-Investigator(Kenkyū-buntansha) |
峯 恒憲 九州大学, システム情報科学研究科(研究院), 准教授 (30243851)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 自然言語処理 / 情報システム / 統計数学 / 人工知能 |
Outline of Annual Research Achievements |
短答式テストとは、質問の回答を1文あるいは2文で返す記述テストの一種である。短答式テストは多肢選択テストに比べ、より真正(authentic)で信頼できると広く考えられており、採点のための技術的な課題が克服されてさえいれば、これを使う潜在的な需要は計りしれない。本研究では、自然言語処理や情報アクセス研究に広く共通する課題である、テキスト間の含意(推論)・換言(同じ意味)・矛盾の認識を可能とする技術を取得し、実際の大学入試試験問題における記述試験採点で、実用に耐えるシステムを試作することを目的とする。採点は、「(テストの作成者が予め用意した)模範解答」と「(被験者の実際の)記述解答」との意味的同一性や含意性を判定することによって行う。システムはWeb にて公開する予定である。 今年度は、以下について研究をおこなった。 1.言語資源の利用に向けた調査・検討(石岡): 含意関係認識に有効と思われる以下の資源およびツールについて調査した。RITE SDK, JAWJAW, WS4J, Wikipedia Redirectなど。また、一般に公開されている利用可能な言語として、奈良先端大(NIST)の作成したJapanese WordNet およびHyponymy extraction tool を用いたWikipedia 上位語・下位語ペア、また京都大学・黒橋研究室の作成した京都大学格フレーム、NTT の提供(有料)する日本語語彙体系について、利用できるか検討を行った。 2.自然言語処理要素技術(峯・石岡): 試験問題のテキストは誤解が生じないようにわかりやすく記述されているが、それでもその解析は容易ではない。ほぼすべての科目を通じて、広い意味での参照関係の解析が必要である。参照関係理解について現状技術のサーベイを行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「知識を問う」問題に対して、含意関係認識を行うプログラムの実装を行うための準備をおこなった。具体的には、日本語構文解析による語句の係り受けと、キーとなる語句の上位語・下位語・同義語などの置き換え、関連知識の検索技術の組み合わせ、および最終判断としての機械学習で達成するための技術の習得を行った。 日本語構文解析については既にあるCaboChaの利用を、機械学習器としてはRandom Forestsの利用を考えており、Random Forestsによる欠測値補完について国際会議等で研究発表をおこなった。
|
Strategy for Future Research Activity |
以下について研究をおこなう。 1.文章や状況の一貫性や自然さの認識(石岡) 国語(英語も)の会話・文章穴埋め問題では、文章や状況の一貫性や自然さを認識する必要がある。そのために接続詞を含む広い意味での接続表現、前の段落を示す指示語、話者の態度や考えを示すモダリティの検出とそれによる接続(付加、解説、論証、例示、転換、制限、譲歩、対比)の判定を、多くの新聞記事の社説やコラムを学習することで解決することを目指す。 2.高度な判断に基づくアプローチ(石岡) さまざまな推論が複雑に絡み合っているような問題に対して、複数の知識を組み合わせで答えを導く方法についても検討を行う。
|
Causes of Carryover |
文部科学省・高大接続会議や中央教育審議会の答申により、本研究代表者の所属する大学入試センターの廃止と改組、それに伴う大学入試センター試験に代わる新テストの導入という、設立以来の大改革に伴う対応のために、当初、予定していた国際会議への参加を取りやめざるを得なくなったため。また、当初予定していたサーバーの購入についても、レンタルサーバーの導入により予算を削減したため。
|
Expenditure Plan for Carryover Budget |
今年度も大学入試センター試験に代わる新テストの導入に伴う作業のために、研究への配分(エフォート)は予定より少なくならざるを得ないが、可能な限り、本研究を遂行するつもりではある。
|
Remarks |
研究代表者(石岡)によるiiWAS2014 (The 16th International Conference on Information Integration and Web-based Applications & Services)での発表論文が The selected papersに選出された。
|
Research Products
(11 results)