研究課題/領域番号 |
04610278
|
研究種目 |
一般研究(C)
|
配分区分 | 補助金 |
研究分野 |
英語・英文学
|
研究機関 | 電気通信大学 |
研究代表者 |
酒井 邦秀 電気通信大学, 電気通信学部, 助教授 (80092609)
|
研究分担者 |
坪井 栄治郎 電気通信大学, 電気通信学部, 助教授 (40180046)
西村 芳康 電気通信大学, 電気通信学部, 助教授 (60172706)
加藤 清方 電気通信大学, 電気通信学部, 助教授 (20185838)
|
研究期間 (年度) |
1992 – 1993
|
研究課題ステータス |
完了 (1993年度)
|
配分額 *注記 |
1,800千円 (直接経費: 1,800千円)
1993年度: 400千円 (直接経費: 400千円)
1992年度: 1,400千円 (直接経費: 1,400千円)
|
キーワード | データベース / コーパス / マルチメディア / 英語教育 / 全文データベース / 正規表現検索 / 英語 / 映画 / 光学式読取装置 |
研究概要 |
4年度に引きつづき、文字・映像・音声・データの収集及び大量のデータから必要な語句を検索するプログラムの制作を行った。 新聞紙、週刊誌については、英米でCD-ROMを利用した全文データベースの発売が相次ぎ、それらを購入した。また4年度より使用を継続している光学式読み取装置ではもっぱら小説の文字字データ収集を行った。最終的に収集された文字データは優に1億語を越えた。これは偏りはあるものの、全文データベースとしては有意な結果を出せるものである。 そこで本年度後半からはその膨大なデータを検索するソフトの制作を開始した。ワープロソフトの検索機能、データベースソフトの検索機能、さらに入力方法などを検討した結果、市販のVZエディタを使って検索ソフトを制作する方向が決まった。 音声・映像データに関しては、文字情報を記録したレーザーディスクの発売が遅れていること、文字(台詞)の正確さの確認に時間がかかり、データは少量に留まっている。(映画20本分ほど) データの収集、検索ソフトの開発状況は以上のようであるが、この2年間で、パーソナル・コンピュータを使ったデータベース・システムの構築が可能であることが立証されたと考える。今後はデータの充実、検索利用システムの実用化を目指し、さらに教育利用の可能性を探っていきたい。
|