研究課題/領域番号 |
08871048
|
研究種目 |
萌芽的研究
|
配分区分 | 補助金 |
研究分野 |
国文学
|
研究機関 | 国文学研究資料館 |
研究代表者 |
松村 雄二 国文学研究資料館, 研究情報部, 教授 (10086689)
|
研究分担者 |
北村 啓子 国文学研究資料館, 研究情報部, 助手 (60204913)
相田 満 国文学研究資料館, 研究情報部, 助手 (00249921)
入口 敦志 国文学研究資料館, 研究情報部, 助手 (80243872)
|
研究期間 (年度) |
1996
|
研究課題ステータス |
完了 (1996年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
1996年度: 2,100千円 (直接経費: 2,100千円)
|
キーワード | 研究論文目録 / キーワード検索 / キーワードの階層化 / データ検索 / データ配列 / 自動配列 |
研究概要 |
大量の国文学研究論文情報をコンピュータによって入力し、時代・分野・研究テーマ・作家作品・論文の内容等の上位から下位にわたる様々な分類の基準を効率的に設定し、これをタグ化することによって、自動的に配列するための実験的システムを開発した。また、これを専用機で運用するために、必要なパソコンを設備した。 自動配列のためのキーワードは6段階に階層化して、それに従って配列できるようにシステムを開発。実際のキーワードについては、平成6年版の『国文学年鑑』における配列を分析検討し、最大5段階に及ぶ配列のための階層化されたデータを作成。これによりかなりの精度で自動的な配列がなされることが確認された。ただし、この階層化されたキーワードはあくまで平成6年版に基づくものであり、膨大なデータを背景とする実際の運用には、さらに多くの年度にわたるデータの分析を蓄積する必要があり、この点に関しては今後の課題となろう。 キーワードの最下層に所属する複数のデータに関しては、配列が著者五十音順・入力順・発表順など機械的な配列になることになるが、一年分のデータではそれほど問題にはならないものの、これも多年度にわたる大量のデータを配列するためにはより下位の階層まで設定しておく必要が生じる。ただし、あまりにも微細にわたる階層化を施した場合、データ作成のための入力作業が繁雑になることが予想される。現段階では6段階くらいの階層化が適当ではないかと考えている。 また、データの検索に関しても、配列による視認はもちろんのこと、階層化されたキーワードをたどることによって、かなりのデータの絞り込みが行え、タイトル内のキーワードによらない検索の可能性を伺わせる結果となった。
|