2006年度におこなった作業は以下のとおりである。 (1)文章コーパスの整備 (1)日本語母語話者の書いた文章の収集:日本語母語話者の書いたジャンル別の文章の収集、データベース化をおこなった。新聞については既存のコーパスを用い(『毎日新聞』のCD-ROM3年分)、社会科学系の論文(「一橋論叢』1年分)、エッセイ(『ベストエッセイ集』3年分)、シナリオ(『年間代表シナリオ集』3年分)についてはスキャナを用いて読みこみ、OCRソフトによって電子資料化をおこなった。 (2)日本語学習者の書いた文章の収集:一橋大学の文章表現の授業(申請者以外が担当する授業も含む)で、過去10数年のあいだに書かれた留学生の作文が400本程度存在するので、それをパソコンに打ちこみ、電子資料化をおこなった。 以上の作業によって、次年度以降に分析をおこなうための基礎資料が整った。 (2)対象とする「談話展開指標」の選定 (1)それぞれのコーパスにおいて、主な接続詞がどのくらいの頻度で用いられているかを調べ、各ジャンルの高頻度語についておおよその見当をつけた。 (2)ある特定の連接関係を誘導しやすいと思われる指標jを、接続詞以外の要素、おもに副詞を中心に幅広く採取した。
|