Research Abstract |
今年度は以下の3つの点に取り組んだ. 1.検索エンジンの特徴分析 現在,WWW上には様々な検索サービスが存在する.代表的なものとしては,GoogleやYahoo!が挙げられるが,各々の検索エンジンが「フレーズ検索」や「自然言語検索」,「ワイルドカード」などの特徴的な検索機能をもつ.また,各検索エンジンは,大文字と小文字を区別する/しないもの,単数形と複数形を区別する/しないものなど,インデックスの差により,検索対象が異なる.そこで,それぞれの検索機能・対象を洗い出し,各々の特徴を分析した. 2.用例の正誤に対するヒット件数の妥当性分析 WWW上から検索した用例の妥当性を判定するために,ヒット件数が利用できると考えられる.しかし,このヒット件数は検索式やキーワードに依存すると考えられる.そこで,各検索機能におけるヒット件数の分布を調査し,ヒット件数の妥当性を分析した.分析の結果,ヒット数はあくまでも参考情報として利用することが望ましいことが分かった. 3.用例検索支援ツールの試作 生きた用例が存在するWWW上のデータを検索対象にして,検索結果を統合・整理し,そこから用例やその他の必要情報を抽出することで,英作文に利用しやすい形で情報提示を行うことを目的に,既存のサーチエンジンを利用した英文検証・用例検索ツールの試作した.試作ツールの特徴としては,(1)複数回の検索が一度で行える;(2)複数の検索結果を統合し,ヒット数でランキング表示できる;(3)妥当な用例を優先的に抽出できる;(4)抽出した用例文をKWIC形式で表示できる;などが挙げられる.評価実験により,有用性の確認を行った.また,問題点,改良点をまとめ,来年度への指針を決定した. 試作ツールは,言語処理学会第11回年次大会にて発表した.また,国際会議へ投稿準備中である.
|