• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

新聞6億字の言語調査と日本語学習者へのWeb出版によるデータ提供

研究課題

研究課題/領域番号 12680235
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 教育工学
研究機関独立行政法人国立国語研究所

研究代表者

横山 詔一  独立行政法人国立国語研究所, 情報資料部門, 領域長 (60182713)

研究分担者 笹原 宏之  独立行政法人国立国語研究所, 研究開発部門, 主任研究員 (80269505)
柳澤 好昭  独立行政法人国立国語研究所, 日本語教育部門, 領域長 (80249911)
米田 純子  独立行政法人国立国語研究所, 情報資料部門, 研究員 (60311156)
野崎 浩成  愛知教育大学, 教育学部, 助教授 (80275148)
久野 雅樹  電気通信大学, 電気通信学部, 助教授 (20282907)
斎藤 秀紀  国立国語研究所, 情報資料研究部, 室長 (70000429)
研究期間 (年度) 2000 – 2002
研究課題ステータス 完了 (2002年度)
配分額 *注記
4,000千円 (直接経費: 4,000千円)
2002年度: 600千円 (直接経費: 600千円)
2001年度: 1,400千円 (直接経費: 1,400千円)
2000年度: 2,000千円 (直接経費: 2,000千円)
キーワード日本語教育教材 / 漢字学習 / ニーズ分析 / 書誌情報データベース / 日本語環境整備 / インターネット / 日本書籍出版協会 / 国際交流基金 / 文字・単語頻度表 / 新聞記事データーベース / Web出版 / WWWブラウザ / 大規模文字データベース / 文字配信システム
研究概要

1.研究の目的
海外の日本語学習者において常に強いニーズがある漢字学習の問題に中心を置き,教材開発の基盤をなす言語資源の作成と,それをWebで海外にも広く流通させる手段の開発を行った。日本語教育の現場では,日本の新聞を教材として活用することが珍しくない。このような状況を鑑み,本研究は,新聞記事の全文データベース(朝日新聞・毎日新聞・日本経済新聞:電子化テキストは購入済み,著作権使用許諾についても新聞社各社と契約済み)を分析の対象とした。これらは,1年あたりで約10万件にものぼる膨大な記事をCD-ROM化した電子メディアであり,言語分析の資料としての価値は高い。
2.研究の方法・結果
まず,新聞6億字の資料を対象に文字・単語の頻度調査を実施し,日本語学習に有用な言語資源を作成した。次に,文字・単語調査で得られた頻度表を,海外の日本語教育機関に提供し,世界のインターネットに流通させるためのシステムを開発した。本研究は,文字・単語頻度表のHTMLあるいはXMLファイルのなかに,インターネット上で公開されている世界最大の「文字GIFデータベース」へのリンク情報を書き込むという方法によって,9万字以上の漢字画像ファイル(文字グリフ)を高速配信できる環境を整備した。
3.波及効果
本研究が開発に寄与した大規模文字グリフ群の高速検索・配信システムは,経済産業省を中心とする「汎用電子情報交換環境整備プログラム」の競争的公募における審査で実績が評価され,その基本技術の一端が経済産業省・総務省・法務省など5省庁連合による電子政府文字情報データベースに採用された。このように,本研究の成果の一部は,我が国の文化情報政策・経済産業政策・行政情報処理を基底から支える知的財産として広く認知されつつあると言えよう。

報告書

(4件)
  • 2002 実績報告書   研究成果報告書概要
  • 2001 実績報告書
  • 2000 実績報告書
  • 研究成果

    (29件)

すべて その他

すべて 文献書誌 (29件)

  • [文献書誌] 近松暢子: "A Japanese Logographic Character Frequency List for Cognitive Science Research"Behavior Research Methods, Instruments, and Computers. 32・3. 482-500 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 横山詔一: "海外WWWブラウザ対応の日本語データ検索システム-『現代雑誌九十種の用語用字:全語彙・表記』を例に-"電子情報通信学会技術研究報告. TL2000・16. 17-24 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 横山詔一: "新聞漢字調査の現状と将来"日本語科学. 9. 33-42 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 横山詔一: "文字・表記分野での計量的研究概観"日本語学. 20・4(臨時増刊号). 157-165 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 久野雅樹: "毎日新聞と朝日新聞における文字使用の差"計量国語学. 23・6. 277-295 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 横山詔一: "日本語図書情報の海外提供システム"日本語学. 21・12. 54-61 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 久野雅樹: "文章理解の心理学"北大路書房. 273 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Nobuko, Chikamatsu: "A Japanese Logographic Character Frequency List for Cognitive Science Research"Behavior Research Method, Instruments, and Computers. Vol.32-3. 482-500 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoichi, Yokoyama: "A Retrieval System for Japanese Language Data for Use with Non-Japanese Browsers"Technical Report IEICE. TL2000-16. 17-24 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoichi, Yokoyama: "A Review of Kanji Frequency Research on Newspapers"Japanese Linguistics. Vol.9. 33-42 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoichi, Yokoyama: "A Mathematical Linguistic Review of Studies on Kanji Characters in Japan"Nihongogaku. Vol.20-4. 157-165 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Masaki, Hisano: "The Difference Between the Use of Kanji in Mainichi Newspaper and Asahi Newspaper"Mathematical Linguistics. Vol.23-6. 277-295 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoichi, Yokoyama: "The Retrieval System of Japanese Library Catalogue for Overseas Users"Nihongogaku. Vol.21-12. 54-61 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 久野雅樹: "毎日新聞と朝日新聞における文字使用の差"計量国語学. 23・6. 277-295 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 横山詔一: "日本語図書情報の海外提供システム"日本語学. 21・12. 54-61 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 横山詔一: "新聞漢字調査の現状と将来"日本語科学. 9. 33-42. (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 横山詔一: "文字・表記分野での計量的研究概観"日本語学. 20・4(臨時増刊号). 157-165 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 横山詔一: "ブランド連想調査(上)連想調査の歴史と意味づけ"日経広告研究所報. 197. 8-14 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 野崎浩成: "漢字2字熟語の頻度特性に関する分析"日本教育工学会誌. 25(suppl.). 59-62 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 笹原宏之: "流通漢字と文字生活-字体の流通から接触・意識・使用へ-"京都大学大型計算機センター第67回研究セミナー東洋学へのコンピュータ利用研究セミナー報告. 38-61 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 井上 優: "ことばと実験"新ことばシリーズ. 13. 78-87 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 久野 雅樹: "文章理解の心理学"北大路書房. 273 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 近松暢子: "A Japanese Logographic Character Frequency List for Cognitive Science Research"Behavior Research Methods, Instruments, and Computers. 32・3. 482-500 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 横山詔一: "海外WWWプラウザ対応の日本語データ検索システム-『現代雑誌九十種の用語用字:全語彙・表記』を例に-"電子情報通信学会技術研究報告. TL2000・16. 17-24 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 笹原宏之: "異体字に対するなじみと好み-接触印象・使用頻度との関係-"日本語科学. 8号. 110-125 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 横山詔一: "資料紹介「今昔文字鏡:単漢字8万字TTF版」"専門図書館. 184号. 45-46 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 久野雅樹: "新聞の用字の面による変動と時系列変動"自然言語処理. 7・2. 45-61 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 横山詔一: "デジタル化時代の日本語第7回:日本語開国の日は"アイ・フィール読書風景. 15号. 26-27 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 横山詔一: "豊かな言語生活のために(新「ことば」シリーズ11)"国立国語研究所・大蔵省印刷局. 94 (2000)

    • 関連する報告書
      2000 実績報告書

URL: 

公開日: 2000-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi