2014 Fiscal Year Research-status Report
中上級者向け日本語コロケーション教材作成に向けたコーパスからの情報抽出とその応用
Project/Area Number |
26370611
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
長谷川 守寿 首都大学東京, 人文科学研究科(研究院), 准教授 (50272125)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | コロケーション / 日本語学習 / 教材開発 / コーパス |
Outline of Annual Research Achievements |
まず、中級後半・上級前半の日本語学習者に向けた、コロケーション学習用教材作成のために、どのようなコーパスから情報を抽出すべきかを、教師が考えた教えるべき項目との関係から明らかにする事を目的として、教材分析を行う。具体的には、実際に使われている語彙教材である小野正樹他(2009)『コロケーションで増やす表現―ほんきの日本語― vol.1』と小野正樹他(2010)『コロケーションで増やす表現―ほんきの日本語― vol.2』をテキスト化した。PDFファイルからテキストファイルへの変換をした後で、模範解答の追加や不要な指示文の削除を行った。さらに、不要となる改行記号等、テキストファイルのクリーニングを行い、正確な結果が得られるように修正した。 次に、そのテキストに含まれる語彙のレベル判定をリーディングチュウ太(language.tiu.ac.jp/)上で行い、教材で使用している文を主に語彙や語種、使われている漢字などから分析した。具体的には、1冊の教科書には30課含まれているので、2冊で合計60課分、全数調査を行い、課による違いも明らかにするために、課毎に結果を集計した。また各課は、導入の部分、意味説明の部分、語形変化の練習の部分、穴埋め問題の部分、実際に用例が含まれる文の読解の部分に分けられるが、問題別の分析を行うために、それらに分けて、結果を記述した。 さらに、それらを集計するプログラムを作成した。プログラムでは、使用されている語彙の日本語能力判定レベルにおける延べ語数と異なり語数が集計できるプログラムを作成した。現在、そのプログラムを用いて集計しているところであるが、形態素解析において誤った語の区切り方をした場合、それによって語彙レベルの誤判定が生じるため、そのような時どのように対処するか、考察中である。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
教科書分析を計量的に行う際のプログラムの作成に苦慮している。使用されている語彙の日本語能力判定レベルにおける延べ語数と異なり語数が集計できるプログラムを作成し、集計しているところであるが、教科書に含まれる文を分析する際に、形態素解析において誤った語の区切り方と、それによって生じる語彙レベルの誤判定をしてしまうことがある。これにどう対処するかに関しては、全ての課の結果を見て判断する必要があり、これに時間がかかっている。 また、対象サブコーパスの選定として、BCCWJのサブコーパスや、「CD-毎日新聞」の紙面別記事で、どのように現れるか、調査する予定であったが、ここでも問題が発生している。「CD-毎日新聞」は既に入手し、紙面別に記事を分離し、データに含まれる問題点も修正し、いつでも検索に用いることができる状態である。しかし、BCCWJについては、文単位のタグを修正した改訂版が2014年度中に入手できると言うことであったが、現在までまだ入手できない状態である。文単位のタグに問題がある現行のBCCWJを対象として、進めてしまうか、新しいBCCWJが入手できるのを待つか、考慮中であり、この部分が止まってしまっている。
|
Strategy for Future Research Activity |
交付申請書に記載した「研究実施計画」に沿って行う予定であるが、文単位のタグを修正したBCCWJの改訂版の入手に時間がかかるようであれば、「CD-毎日新聞」を中心に調査を進め、入手できた段階で、結果を比較するという手順をとることを考えているが、その際に問題は発生しないか、検討している。
|
Causes of Carryover |
次年度使用額が生じた理由は、形態素結果の確認を研究協力者に依頼する予定であったが、基となるテキスト化とそのクリーニングに予想以上に時間がかかってしまい、確認作業に入ることができなかったため、人件費を使うことができなかったことが大きい。また、改訂版のBCCWJが購入できなかったため、その他での使用もなかった。。
|
Expenditure Plan for Carryover Budget |
研究協力者に確認作業を依頼することに人件費を使い、作業を早める。
|
Research Products
(1 results)