1996 Fiscal Year Annual Research Report
インターネットにおける学術漢字の符号化に関する研究
Project/Area Number |
08207122
|
Research Institution | The National Institute for Japanese Language |
Principal Investigator |
斎藤 秀紀 国立国語研究所, 情報資料研究部, 室長 (70000429)
|
Co-Investigator(Kenkyū-buntansha) |
菱沼 透 創価大学, 文学部, 教授 (30015945)
大坪 一夫 東北大学, 文学部, 教授 (20115538)
横山 詔一 国立国語研究所, 情報資料研究部, 主任研究官 (60182713)
柳沢 好昭 国立国語研究所, 日本語教育センタ, 室長 (80249911)
|
Keywords | 新聞記録データベース / 漢字データベース / イメージ処理 / 電子メディア / 漢字使用頻度表 / 漢字認知 / コーパス / 漢字の意味 |
Research Abstract |
1.今年度は、1966年発行朝日・毎日・読売朝夕刊の用語用字調査で1/60の面サンプリングの対象となつた切り抜き記事をイメージでデータベースに記録するプログラムを作成し、朝日新聞について入力作業を行った。本プログラムは、新聞切り抜き記事データをスキャナから読み込み、クライアント・サーバ環境においた2台のパーソナル・コンピュータで実行するシステムである。イメージ情報として新聞記事をデータベースとした目的は、新聞調査のデータ保存の他、漢字と文列データベースの原簿として理容師、校正漏れに対する補助手段とするために設けた。検索処理は、サーバにおいた新聞記事のイメージ・データをクライアンから直接または漢字データベースを介して検索を行う。指定できる検索キ-の種類は、新聞種類、発行月、日、紙面のページ、サンプリング・ブロック番号の5種である。また、画面に表された新聞切り抜き記事は、画面上で拡大、縮小、切り取り、ファイル出力を指定する機能を設けた。検索処理およびイメージの読み込みプログラムは、Visual BasicとVisual Cを使用した。また、データ葉、圧縮記録した。 2.朝日新聞記事全文データベースに出現するすべてのゲタ文字「=」を大型汎用計算機で検索し、縮刷版と照らし合わせて実際の紙面での表記を同定した。それらの一覧表を作成したところ、ゲタ文字は、「真正」、「不正」、「隠れ」の3つのタイプに分類できることが明らかになった。不正ゲタ文字と隠れ文字をめぐって、その出現を招いた原因を推論した。 3.「英日漢計算機詞彙」(中国科学院)の入力の継続およびファイルの修正を行った。また、上記のファイルに出現する漢字のうち、出現頻度の高い漢字について、一般語(主として小説の言語)における意味・用法を調べ、両者の比較を行った。
|
Research Products
(14 results)
-
[Publications] 斎藤秀紀: "漢字情報と文例情報を結合した日本語データベースの構築" 情報処理学会研究会報告96-CH-30-7. vol.96. 35-40 (1996)
-
[Publications] 斎藤秀紀: "JISに無い字をどう扱うか-具体的事例報告" 人文学と情報処理. No.10. 22-25 (1996)
-
[Publications] 野崎浩成・横山詔一・米田純子: "「文字使用に関する計量的研究-日本語教育支援の観点から-」" 「日本教育工学会論文誌」. 印刷中. (1997)
-
[Publications] 野崎浩成・横山詔一: "「朝日新聞CD-ROMによる漢字頻度基準表の作成と数量分布」" 人文科学における数量的分析シンポジウム. 11-14 (1996)
-
[Publications] 横山詔一・野崎浩成: "「コーパスを利用した日本語環境の分析」" 日本行動計量学会第24回大会特別セッション. 138-139 (1996)
-
[Publications] 野崎浩成・横山詔一: "「新聞と雑誌における漢字使用頻度の分析-心理学での材料統制の観点から-」" 日本行動計量学会第24回大会. 266-267 (1996)
-
[Publications] 横山詔一・野崎浩成: "心理学のための漢字頻度基準表の作成(1)" 日本心理学会第60回大会. 599 (1996)
-
[Publications] 野崎浩成・横山詔一: "心理学のための漢字頻度基準表の作成(2)" 日本心理学会第60回大会. 600 (1996)
-
[Publications] 近藤公久・天野成章・横山詔一: "「漢字の親密度と出現頻度の相関」" 日本心理学会第60回大会. 601 (1996)
-
[Publications] 野崎浩成・横山詔一ほか: "「漢字使用頻度の時代的変化に関する考察」" 計量国語学会第40回大会. 8 (1996)
-
[Publications] 横山詔一・野崎浩成: "「頻度辞書の公開を目指して」" 日本心理学会第60回大会ワークショップ講演資料. (1996)
-
[Publications] 横山詔一・野崎浩成・米田純子: "「新聞の漢字使用順位に影響する要因の分析」" 計量国語学会第40回大会. 7 (1996)
-
[Publications] 菱沼透: "「形容詞"好""懐"の意味構造」" 中国語教育研究会資料. (1996)
-
[Publications] 横山詔一: "「表記と記憶」" 「心理学モノグラフNo.26」, 100 (1997)