1996 Fiscal Year Annual Research Report
国文学言語地図作成のための国文学研究語彙電子化辞書形成の研究
Project/Area Number |
08207241
|
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
松村 雄二 国文学研究資料館, 研究情報部, 教授 (10086689)
|
Co-Investigator(Kenkyū-buntansha) |
北村 啓子 国文学研究資料館, 研究情報部, 助手 (60204913)
江戸 英雄 国文学研究資料館, 研究情報部, 助手 (50290870)
入口 敦志 国文学研究資料館, 研究情報部, 助手 (80243872)
|
Keywords | 国文学 / 研究語彙 / 国文学研究地図 / 同義語 / 連想語 / 階層化 / 電子化辞書 / データベース |
Research Abstract |
本年度の研究計画に従い,本年度は,概算6万件を有する研究語彙リスト上で,上代,中古,中世の各領域について,基準語のカナ付け,同義語およびの階層化,固有名詞やダブり語彙の削除統合などのデータ初期整備を行った。リスト上におけるこの整備では,平成9年2月末の時点で,ほぼ15,000件弱のデータをチェックし終えた。これは今年度の当初計画として立てた2万件に及ぶことができなかった。ついでこれをデータシート上に移して清書した件数は約7,000件,さらに前年度に作成した基本研究語彙約17,000件の基礎データを組み込んだ「第一次国文学研究語彙電子化辞書」に修正入力したが,この件数はほぼ1,000件である。電子化辞書への入力が少ないのは,この時点でデータ組み込み済みの使用可能なパソコンが一台しかなかったという単純な理由による。リスト上での初期整備が予定どおり進まなかったのは,やはり当初から困難が予想されたように,同義語の認定が難しいという点に帰せられる。作業にあたる大学院生個々の力量にも左右されるが,一つの基準語に対してかなり辞典・索引類から当たり直すという慎重な調査が要求され,作業ペースとしては1日8時間で平均50〜70件をこなせるのがやっとであり,謝金申請額80万円,117人日ではこれが精一杯であった。従って次年度以降にまだ3万件以上が残る勘定になるが,これには上記研究語彙電子化辞書ソフトの機能を拡張したり,パソコン台数をもっと増やすなどの処置でかなりの部分対応することができよう。 なおローマ字化に関しては,電子化辞書に組み込み済みの17,000件については機械的な一括変換処理を施したので,その部分に限り終了している。英語化は個々に目についてものをランダムに入力しつつある。
|
Research Products
(1 results)