2002 Fiscal Year Annual Research Report
全電子化検定済み教科書データの解析と大規模日本語コーパスの構築
Project/Area Number |
14380174
|
Research Institution | Tokyo University of Foreign Studies |
Principal Investigator |
佐野 洋 東京外国語大学, 外国語学部, 助教授 (30282776)
|
Co-Investigator(Kenkyū-buntansha) |
藤村 知子 東京外国語大学, 留学生日本語教育センター, 助教授 (20229040)
峰岸 真琴 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (20190712)
芝野 耕司 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (50216024)
|
Keywords | 日本語情報処理 / 大規模基本語コーパス / 計量言語学 / コーパス言語学 |
Research Abstract |
電子化された検定済み日本語コーパスのうち,今年度は,国語(65ファイル),社会(209ファイル),家庭科(11ファイル)の合計285ファイルの電子化された教科書テキストを,形態素解析した上で分析を実施した。とりわけ低学年用教科書は,ひらがなの使用頻度が高く,コンピュータを使った形態素解析では解析誤りが発生する。これらの解析誤り部分を特定し,手作業による修正を施すと同時に,誤り部分の言語(日本語)学的なアプローチによる分析・調査をおこなった。その結果,初等中等用教科書に顕著なひらがな表記に起因する解析誤りだけではなく,形態素解析の言語分析性能に因る箇所が見いだされた。これらをタイプ分類し,それらの現象を整理した。来年度は,このタイプ分類を参照して,他の教科の電子化コーパスを分析する予定である。 日本語の形態素解析のためのソフトウェアは,茶筅(奈良先端大学院大学・松本研究室で開発)を使用した。今年度,形態素解析されたコーパスの分析を支援するソフトウェアを開発した。日本語の語分析用のソフトウェアで,その使用過程で改良を加えた,これらのプログラムはフリーソフトウェアとして公開する予定である。
|
Research Products
(6 results)
-
[Publications] 佐野洋: "ESP適合の教材コンテンツを実現する語学教育支援システム"『最新外国語CALLの研究と実践』,外国語教育研究部会,CIEC会誌. (CD-ROM出版). 8 (2003)
-
[Publications] 佐野洋: "日本語調査用ツールCLTOOL"『語学研究所論集』,語学研究所,東京外国語大学. 8号. 10 (2003)
-
[Publications] 佐野洋, 幸松英恵: "外国人のための日本語教育教材の問題点について"コンピュータと教育研究会報告,情報処理学会. Vol.2002, No96. 37-44 (2002)
-
[Publications] 佐野洋: "ソフトウェア再利用による語彙調査用ツールの開発"言語処理学会年次大会講演論文集,言語処理学会. 679-682 (2003)
-
[Publications] 佐野洋: "ESP適合の教材生成を目指した語学教育支援システム"情報処理学会全国大会後援論文集,情報処理学会. 4 (2003)
-
[Publications] 佐野洋: "WindowsPCによる日本語研究"共立出版(出版予定). 200 (2003)