2004 Fiscal Year Annual Research Report
全電子化検定済み教科書データの解析と大規模日本語コーパスの構築
Project/Area Number |
14380174
|
Research Institution | Tokyo University of Foreign Studies |
Principal Investigator |
佐野 洋 東京外国語大学, 外国語学部, 教授 (30282776)
|
Co-Investigator(Kenkyū-buntansha) |
芝野 耕司 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (50216024)
峰岸 真琴 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (20190712)
藤村 知子 東京外国語大学, 留学生日本語教育センター, 助教授 (20229040)
|
Keywords | 日本語情報処理 / 大規模基本語コーパス / 計量言語学 / コーパス言語 |
Research Abstract |
昨年度,漢字調査を実施した。従来の単漢字における漢字の性質や文章中での使用頻度では,漢字の分布の様相が捉えられなかったが,分析によって漢字の使用の様相が明らかになってきた。 今年度は,上述の分析に改良を加え,文節単位での漢字の使用の様相を分析し,さらに文節単位での語形の使用の様相を分析した。語形は理由を示す「から」をとりあげ,「から」を含む従属節の語形と主節の語形の対応について,形態的視点,構文的な特徴,そして意味的な連関について調査した。その結果,「から」を用いる場合,従属節と主節の因果関係の種類,因果関係を支える信念の違いが語形に反映されていることが分かった。日本語コーパスを用いて計量的な分析を行った。 昨年度開発した日本語検索ツールを,多言語の検索できるように改良した(UTF-8で文字処理を実施できるようにした)。同時に,検索ツールの操作ガイド部分の多言語化を行い(中国語(簡体字,繁体字),ロシア語,朝鮮語),海外でも日本語検索ツールを容易に利用できるよう改良した。海外での日本語教育の教材作成に役立てることを目指している。 昨年度,英語教科書を入手した。今年度は,英語文章での語彙分析も試みた。英語文型ごとに英語コーパスを検索できる仕組みの中で,英語の語彙レベルを指定して,文型検索ができる仕組みを開発した。語彙レベル指定機能を使って英文抽出を実施した。
|
Research Products
(1 results)