研究課題/領域番号 |
25540163
|
研究機関 | 大阪大学 |
研究代表者 |
堀 一成 大阪大学, 全学教育推進機構, 准教授 (80270346)
|
研究分担者 |
坂尻 彰宏 大阪大学, 全学教育推進機構, 准教授 (30512933)
石島 悌 地方独立行政法人大阪府立産業技術総合研究所, 製品信頼性科, 主任研究員 (80359398)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 学習コンテンツ / 日本語コーパス / データマイニング / アカデミック・ライティング / 大学リポジトリ / コロケーション / BCCWJ / eラーニング |
研究実績の概要 |
平成26年度は、XML化されていない学術的文章データの代表である、大学リポジトリ蓄積論文データの解析と、学部初年次生配布小冊子教材の改善作業を主に行った。 まず、学術的文章データの代表として、大阪大学リポジトリOUKAに公開されている日本語で記述された博士論文10件の本文テキストデータを処理対象として選定した。選定にあたっては、学問分野に偏りがないよう、特に留意した。平成25年度成果の、国立国語研究所日本語書き言葉コーパスを解析した際の手法を適用し、形態素解析ソフトMecabと統計ソフトウェアを利用し、対象とする博士論文に出現する頻度の高い動詞・名詞のリストを得た。この形態素解析により得られるデータは、国立国語研究所の分析言語単位としては、短単位による解析データと分類されるものである。 また、本研究で得られた成果も一部含む内容を持つ、大学初年次生向けライティングテキスト「阪大生のためのアカデミック・ライティング入門 第2版」を作成した。主な改訂点は、与えられたレポート課題等から、実際のレポートの詳細構成を組み上げるに至る課程の詳細な説明を追加したことである。印刷冊子を平成27年4月入学の学部初年次生に配布するとともに、広く利用できるよう、大阪大学リポジトリOUKA上で公開した。ライティングテキストのデータは、視覚障害を持つ学習者にも配慮し、大文字版・大文字白黒反転版も公開している。 上記の成果は、大学教育学会第36回全国大会・第16回図書館総合展・大学教育改革フォーラムin東海2015などの学会等で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成26年度の研究予定事項は、大阪大学リポジトリOUKAより、学術文に特徴的な言語情報を抽出すること、教材開発を進展させることである。 学術文に特徴的な言語情報を抽出する作業については、リポジトリ上の博士論文データを対象とし、使用頻度の高い動詞・名詞のデータを得ることができた。ただし、その対象としたテキストデータ規模は、信頼できるデータ抽出が得られるデータサイズには至っていない。また、専門用語などの言語特徴をとらえるには、本来、国立国語研究所の分析言語単位である長単位を対象に解析すべきであり、その解析用ソフトウェアComainuの導入作業が進んでいないことから、より有効な言語特徴データはいまだ得られていない状況だといえる。 教材開発については、平成25年度中に作成し、平成26年度当初に大阪大学学部初年次生向け配布を行った「阪大生のためのアカデミック・ライティング入門」を、改訂する作業を進展させている。この教材は本来平成27年度末の研究終了時点で完成していることを予定していたものであり、計画以上に進展しているといえる。 以上の理由により、本研究の達成度が「おおむね順調に進展している」状況であると判断した。
|
今後の研究の推進方策 |
平成27年度は、大阪大学リポジトリOUKAより、学術文に特徴的な言語情報をより大規模に抽出し、教材提示できる形でまとめることが主な作業内容となる。国立国語研究所の分析言語単位である長単位を対象に解析すべきであり、その解析用ソフトウェアComainuの導入作業を早急に進め、長単位言語情報の抽出作業を開始する予定である。また、可能であれば大学リポジトリ以外の学術文データを対象とし、より広範なデータに基づく特徴抽出を行いたいと考えている。 大阪府立産業技術総合研究所においては、技術報告文書からの特徴抽出を行い、大阪大学で作成した教材を参考に、若手研究者が論文・技術報告書を作成する際の参考資料となる教材作成を行う。 得られた研究成果は、各種の産官学フェアや学会発表等で成果公開する。また、得られた研究成果に基づく、大学学部初年次生向けアカデミック・ライティングテキストの追加資料を作成し、教材として利用を開始する。またその成果を大阪大学リポジトリOUKA上で公開する。
|
次年度使用額が生じた理由 |
平成26年度のアルバイトによる研究補助作業の進展が、計画通り進行できなかったことと、購入を予定していた教材作成用ノートPCが平成26年度中に発売にならず、延期となったためその購入資金を次年度に残す必要があったことが、次年度使用額が生じた主な理由である。研究の進展に伴い、対象作業がデータベースと統計プログラムだけでなく、自然言語処理の専門知識を必要とするものとなり、担当可能なアルバイト作業者の確保が困難であった。
|
次年度使用額の使用計画 |
平成27年度中の研究補助作業アルバイト確保を、より積極的に行う。大学内の類似の関連の研究を行っている大学院生などを対象に加え、広く募集する予定である。最終年度の研究計画進展加速のため、大量の解析と、大規模データベース管理を可能とする、ワークステーション購入を計画し、経費執行計画の再度見直しを図る。また、平成26年度中に購入できなかった教材作成用ノートPCは、本報告作成時点である平成27年4月時点で発売が発表されており、早急に購入し研究進展に活用する予定である。
|