Research Abstract |
本研究では,Web上に存在する活きたデータ(Webコーパス)とオンライン辞書や新聞・論文アーカイブなど電子化された言語資源を活用して,英文作成のための有益な情報提供を目的とした英文作成支援ツールの構築を目的とする. 現在開発中の英文作成支援ツールは,Webアプリケーションであり,英文作成,Web・用例検索,マイニングの3つのモジュールで構成される.英文作成モジュールは,入力された和文・表現を形態素解析し,各種の電子化言語資源またはそこから抽出された情報を利用して,対訳候補をランキング提示する機能や有用サイトへのリンク,英文テンプレートなどを提供する.マイニングモジュールは,検索ログをマイニングすることで,苦手な単語や表現,構文などを分析する.また,単語・表現帳などを自動生成することで,英語の学習支援を実現する.本年度は,3つのモジュールの内,Web・用例検索を中心に研究を進めた. Web・用例検索モジュールは,昨年度試作した支援ツールを改良することで,より使いやすいものを実現した.まず,ツールのコアには,Google Web APIsを採用し,Googleのもつ様々な検索能力を活かせるようになった.ツールの新しい特徴としては,(1)入力を短い表現と文に分類することで,浅い支援と深い支援を実現;(2)用例の抽出に形態素解析を組み込み,妥当な用例が優先的に抽出可能,(3)出力結果をドメイン毎に分類して表示可能;などが挙げられる.特に,(1)の文を対象とした支援では,文をn-gramに分割することで,得られるヒット数の問題を回避した.また,ヒット数をn-gram単位のグラフで視覚的に表示することで,誤りの検出を効果的に行える工夫を施した.現在は,インターネット上での公開に向け,準備を進めている. 以上の内容は,各種学会で発表し,参加者とディスカッションを行うことで,有用性と今後の課題を整理することができた.
|