研究分担者 |
笹原 宏之 国立国語研究所, 言語体系研究部, 主任研究官 (80269505)
柳澤 好昭 国立国語研究所, 日本語教育センター, 室長 (80249911)
斎藤 秀紀 国立国語研究所, 情報資料研究部, 室長 (70000429)
野崎 浩成 愛知教育大学, 教育学部, 助手 (80275148)
久野 雅樹 電気通信大学, 電気通信学部, 助教授 (20282907)
|
研究概要 |
海外の日本語学習者において常に強いニーズがある漢字学習の問題に中心を置き,教材開発の基盤をなす言語資源の作成と,それをWeb出版の形で海外にも流通させる手段の開発を行った。 日本語教育の現場では,日本の新聞や雑誌を教材として活用することが珍しくない。このような状況を鑑み,新聞記事の全文データベース(朝日新聞・毎日新聞・日本経済新聞)を分析の対象として,新聞記事10年分約6億文字以上のテキストデータに基づいて,文字頻度と単語頻度の調査を実施した。そこで得られた文字・単語頻度表に基づいて,新聞によく登場する漢字がどのような熟語・用例で使用されるのか,その年次変動はどの程度なのか,新聞社によって文字・単語の使用傾向に違いがあるのか,などを調査・研究し,その成果の一部を韓国の日本語学会国際シンポジウムや国内外の査読付き学術誌に発表した。 また,Web出版の新技術として,『現代雑誌九十種の用語用字:全語彙・表記』(国立国語研究所言語処理データ集No.7,1996,三省堂;通称,雑誌九十種)を例に,そのデータを海外のWWWブラウザ(いわゆるホームページ閲覧ソフト)で検索できるシステムの第1版を開発した。このシステムの特長は,大規模な文字GIFデータベース(漢字9万字)を備えた「文字配信サーバ」と,それとは別の場所にある「データベース検索サーバ」をインターネット上で連動させて,検索結果の日本語を海外のWWWブラウザに高速配信できるようにした点にある。(この技術は,当課題の研究協力者によって,米国商務省にビジネスモデル特許として出願中である。)
|