2000 Fiscal Year Annual Research Report
新聞6億字の言語調査と日本語学習者へのWeb出版によるデータ提供
Project/Area Number |
12680235
|
Research Institution | The National Institute for Japanese Language |
Principal Investigator |
横山 詔一 国立国語研究所, 情報資料研究部, 主任研究官 (60182713)
|
Co-Investigator(Kenkyū-buntansha) |
笹原 宏之 国立国語研究所, 言語体系研究部, 主任研究官 (80269505)
柳澤 好昭 国立国語研究所, 日本語教育センター, 室長 (80249911)
斎藤 秀紀 国立国語研究所, 情報資料研究部, 室長 (70000429)
野崎 浩成 愛知教育大学, 教育学部, 助手 (80275148)
久野 雅樹 電気通信大学, 電気通信学部, 助教授 (20282907)
|
Keywords | 日本語教育教材 / 漢字学習 / 文字・単語頻度表 / 新聞記事データーベース / Web出版 / WWWブラウザ / 大規模文字データベース / 文字配信システム |
Research Abstract |
海外の日本語学習者において常に強いニーズがある漢字学習の問題に中心を置き,教材開発の基盤をなす言語資源の作成と,それをWeb出版の形で海外にも流通させる手段の開発を行った。 日本語教育の現場では,日本の新聞や雑誌を教材として活用することが珍しくない。このような状況を鑑み,新聞記事の全文データベース(朝日新聞・毎日新聞・日本経済新聞)を分析の対象として,新聞記事10年分約6億文字以上のテキストデータに基づいて,文字頻度と単語頻度の調査を実施した。そこで得られた文字・単語頻度表に基づいて,新聞によく登場する漢字がどのような熟語・用例で使用されるのか,その年次変動はどの程度なのか,新聞社によって文字・単語の使用傾向に違いがあるのか,などを調査・研究し,その成果の一部を韓国の日本語学会国際シンポジウムや国内外の査読付き学術誌に発表した。 また,Web出版の新技術として,『現代雑誌九十種の用語用字:全語彙・表記』(国立国語研究所言語処理データ集No.7,1996,三省堂;通称,雑誌九十種)を例に,そのデータを海外のWWWブラウザ(いわゆるホームページ閲覧ソフト)で検索できるシステムの第1版を開発した。このシステムの特長は,大規模な文字GIFデータベース(漢字9万字)を備えた「文字配信サーバ」と,それとは別の場所にある「データベース検索サーバ」をインターネット上で連動させて,検索結果の日本語を海外のWWWブラウザに高速配信できるようにした点にある。(この技術は,当課題の研究協力者によって,米国商務省にビジネスモデル特許として出願中である。)
|
Research Products
(7 results)
-
[Publications] 近松暢子: "A Japanese Logographic Character Frequency List for Cognitive Science Research"Behavior Research Methods, Instruments, and Computers. 32・3. 482-500 (2000)
-
[Publications] 横山詔一: "海外WWWプラウザ対応の日本語データ検索システム-『現代雑誌九十種の用語用字:全語彙・表記』を例に-"電子情報通信学会技術研究報告. TL2000・16. 17-24 (2000)
-
[Publications] 笹原宏之: "異体字に対するなじみと好み-接触印象・使用頻度との関係-"日本語科学. 8号. 110-125 (2000)
-
[Publications] 横山詔一: "資料紹介「今昔文字鏡:単漢字8万字TTF版」"専門図書館. 184号. 45-46 (2000)
-
[Publications] 久野雅樹: "新聞の用字の面による変動と時系列変動"自然言語処理. 7・2. 45-61 (2000)
-
[Publications] 横山詔一: "デジタル化時代の日本語第7回:日本語開国の日は"アイ・フィール読書風景. 15号. 26-27 (2001)
-
[Publications] 横山詔一: "豊かな言語生活のために(新「ことば」シリーズ11)"国立国語研究所・大蔵省印刷局. 94 (2000)