2011 年度実績報告書

実用的な明朝体漢字字形データベースの運用と応用

研究課題

研究課題/領域番号	22700262
研究機関	大東文化大学
研究代表者	上地宏一大東文化大学, 外国語学部, 講師 (20468721)
キーワード	コンピュータ漢字処理 / 文字データベース / 異体字 / Unicode
研究概要	本研究は、日本・中国をはじめとする東アジア圏の現代・古典資料などの文字情報に使用された、異体字・国字などのあらゆる漢字字形を登録可能な文字データベースを、インターネット上に構築・運用するものである。平成23年度の研究成果は次の3点に集約される。 1、登録データ利用の実証実験の完了前年度までの研究成果をもとに、漢字字形データベースに登録されている漢字グリフをWebフォントを活用することで外部の学術データベースの外字処理として利用するための実証実験が完了した。引き続き論文としてまとめ、外部に発表するする段階に移ることとなる。 2、登録データを利用したデザイン支援機構の構築前年度までの研究成果をもとに、漢字字形データベースに登録されているデータを活用して機械的に漢字字形を生成するプログラムのプロトタイプが完成した。引き続き、最終的な微調整を行うためのユーザーインターフェースの設計と、Webサービスとしての公開に向けて作業を継続することとなる。このほかに、異体字関係にある2つの漢字字形のどこに差異があるかを記述するためのメタ情報を「漢字異体化データベース」としてまとめた。 3、日本国内外の漢字字形資料の効率的な収集・登録前年度に引き続き漢字字形のデータ登録を継続し、以下の漢字集合の収録が完了した。・ISO/IEC10646規格、CJK統合漢字拡張B集合(42,711字) ・Unicode標準、IVD集合(2010-11-14登録分)(18,842字) ・和製漢字の辞典(大原望氏による国字収集データベース)(字形不明の2字を除く2,749字) ・『国字の辞典』(飛田良文、菅原義三、東京堂出版、平成2年)(1,556字) .住民基本台帳ネットワーク統一文字、漢字部分(19,432字) 以上により、ISO/IEC10646規格の漢字部分(75,619字)を完全に収録することとなった。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由当初の目的に沿った研究内容を遺漏なく実施することができたが、研究成果についての論文・発表による公開に一部至ることができなかったため、「おおむね」と評価した。
今後の研究の推進方策	最終年度として、これまでの各成果をまとめ、広く社会に還元するための広報活動により重点を置くべきと考える。また漢字字形データの蓄積については、引き続き行うべきであると考える。

研究成果
(4件)

すべて 2012 2011 その他

すべて雑誌論文 (2件) 図書 (1件) 備考 (1件)

[雑誌論文] 明朝体漢字の異体化データベースについて2012
- 著者名/発表者名
  上地宏一
- 雑誌名
  
  東洋学へのコンピュータ利用第23回研究セミナー
  
  ページ: 3-31
[雑誌論文] 漢字処理の現状-文字コード、フォント、外字-2011
- 著者名/発表者名
  上地宏一
- 雑誌名
  
  三色旗
  
  巻: 第761号ページ: 3-8
[図書] 電脳中国学入門2012
- 著者名/発表者名
  漢字文献情報処理研究会編
- 総ページ数
  12-19
- 出版者
  好文出版
[備考]
- URL
  http://glyphwiki.org/