研究目的は、コーパス研究を発展させるために、1.意味情報、2.音声・映像情報、2.インターネット上で公開されている全文書、という3種類のデータをWebブラウザーから検索するソフトウェアを開発し、研究者に対してインターネット上で無料公開することである。本年度は、基本的なコンピュータ・プログラムを作成して、その一部をインターネット上で無料公開した。具体的な実績は次のとおりである。 1.「FrameNetからの意味情報検索ソフトウェアの開発」 統語情報と意味情報の検索・表示を行うために、国際コンピュータ科学研究所(米国カリフォルニア州)とバルセロナ自治大学(スペイン)で研究が行われているFrameNet全データをインターネットからダウンロードして、データベースに登録した。本研究費の旅費を利用して、バルセロナ自治大学に赴き、研究者から専門的な助言を受け、データベースの検索プログラムを改良した。 2.「アメリカ映画の音声・映像データをWebブラウザーから検索するソフトウェアの開発」 アメリカ映画約1500作品のセリフから使用頻度の高い表現を選び出し、その表現をWebブラウザーから検索し、その表現が使われている場面を再生して、音声・映像を確認できるソフトウェアを開発し、ホームページで公開した。 3.「インターネット上で公開されている全文書を検索するソフトウェアの開発」 インターネット検索エンジンを利用して、インターネット上の文書を巨大コーパスとして利用するソフトウェアを開発した。検索結果として表示される英文には、日本人研究者には難解な表現が含まれるため、それを電子辞書で瞬時に調べることができる機能もソフトウェアに組み入れた。開発したソフトウェアを短期間、インターネット上で無料公開をして、ユーザーの意見を聞き、それを参考にして機能を改良した。
|