2011 Fiscal Year Annual Research Report
試験問題統計情報のデータベース化と自然言語処理技術を用いた統計的解析
Project/Area Number |
21300320
|
Research Institution | The National Center for University Entrance Examinations |
Principal Investigator |
石岡 恒憲 独立行政法人大学入試センター, 研究開発部, 教授 (80311166)
|
Co-Investigator(Kenkyū-buntansha) |
大津 起夫 独立行政法人大学入試センター, 研究開発部, 教授 (10203829)
橋本 貴充 独立行政法人大学入試センター, 研究開発部, 助教 (20399489)
櫻井 裕仁 独立行政法人大学入試センター, 研究開発部, 准教授 (00333625)
中済 光昭 駒澤大学, 経済学部, 准教授 (60306917)
|
Keywords | 自然言語処理 / 情報システム / 統計数学 / 人工知能 |
Research Abstract |
試験問題の属性には ・素材文、あるいは選択肢の難読性に関するもの ・出題形式に関するもの(質問形式、選択肢数など) ・素材文のジャンル(現代文(評論・小説)/古文/漢文、会話文/説明文などの別) に関するものがあり、これらの属性による難易度予測と、試験情報データベースとのシームレスな統合を実現するために、システムの開発やデータベースの整備を図る。今年度は以下を実施した。 1)大学入試センター試験について,解答に関わる統計情報をデータベース化した。 2)過去に実施した全ての法科大学院適性試験の試験問題について,統計情報をデータベース化した。 3)多肢選択以外の解答方式の研究として,文末モダリティによる日本語文の構造分析を行った。 4)欠測値を補完する方法として集団学習の方法の一つであるRandom Forestsに着目し、教師データのみならず教師なしデータに対しても適用できるよう拡張する方法を考案した。またそのRプログラムを作成した。 次ページ以降に記載の通り、実りある研究成果を上げた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の目的であった、試験情報データベースとのシームレスな統合を果たすシステムが試作され、それに伴う多くの関連研究についての成果が公開された。また昨年度は、自然言語処理技術を用いた情報検索、情報抽出、情報推薦の要素技術を確立ならびに洗練させるために、日本OR学会、人工知能学会等が主催するリコメンデーションコンテストに参加し、上位入賞を果たした。
|
Strategy for Future Research Activity |
昨年度、欠測値を補完する方法として集団学習の方法の一つであるRandom Forestsに着目し、教師データのみならず教師なしデータに対しても適用できるよう拡張する方法を考案したが、これを論文にまとめ、国際会議で発表する。さらに半教師データに対しても適用できる方法について研究を進め、別の国際会議で発表する予定である。
|
Research Products
(5 results)