2003 Fiscal Year Annual Research Report
インターネットを利用した英語データベースの構築とその活用法に関する研究
Project/Area Number |
15652029
|
Research Institution | University of Tsukuba |
Principal Investigator |
鈴木 英一 筑波大学, 現代語・現代文化学系, 教授 (30004071)
|
Keywords | 英語 / 言語データベース / インターネット / e-mail service / ニュース配信サービス / オンライン・ニュース / 言語データ検索 |
Research Abstract |
初年度の平成15年度には,主にインターネットから良質の英語のデータを入手する方法,具体的には,(1)良質の英語データを含むウェブサイトを発見する方法,(2)インターネットニュースから英語データを抽出する方法,(3)ウェブページの中から良質の英語データを含むページを見つける方法を検討し,さらに,(4)ウェブページから英語データを検索するために,現在利用可能な方法を再検討し,より適切な方法を探った. まず,良質の英語データを含むウェブサイトしては,英語の書物のデータベースを所蔵するProject Gutenbergがある.ここには聖書や文学作品だけでなく,最近のCIA World Factbookのような書物も含まれており,利用価値が高い. また,良質な英語データを豊富に提供してくれるものに,新聞社やテレビ局のウェブサイトがある.USA TodayやNew York Timesなどの新聞には電子版があり、また、CNN、ABC、CBS、NBCというテレビ局にはオンライン・ニュースがあり,政治・経済・法律・工業技術・健康・旅行・娯楽・教育など広範囲な今野を網羅する記事が掲載されており,様々な英語研究に大変有用である. さらに,良質な英語のデータは,新聞社やテレビ局が行っているe-mailによるニュース配信サービスを利用して得ることができる.CNNのE-mail Servicesは,特に充実しており多くの分野のニュースが配信され,大いに利用できる.しかし,配信e-mailは記事の要約であるので,配信e-mailとウェブサイトに掲載されている完全な記事を組み合わせることによって,より充実した英語のデータベースを作成することが可能になる. ウェブページからの英語データの検索法としては,現行の検索エンジンでは不十分であり,正規表現の利用が可能な検索プログラムが必要であり,今後検討していきたい.
|