研究課題/領域番号 |
19500133
|
研究機関 | 龍谷大学 |
研究代表者 |
馬 青 龍谷大学, 理工学部, 教授 (30358882)
|
研究分担者 |
吉見 毅彦 龍谷大学, 理工学部, 准教授 (50368031)
渡辺 靖彦 龍谷大学, 理工学部, 講師 (10288665)
|
キーワード | 英作文支援 / 日英混在文 / 高品質コーパス / Webデータ / 検索 / 訳語選択 |
研究概要 |
本研究はユーザが英作文する過程において、部分的に適切な英語表現(単語、フレーズ、または節など)が思い浮かばないとき、本来言い表したい日本語表現をそのまま入力するだけで、すなわち、日英混在の入力文から状況に応じて動的に構成される文脈情報と、高品質大規模な英語コーパスに加え超大規模なWebデータも統合的に利用することにより、適切な英語表現を自動生成してくれる支援システムの研究開発を目指すものである。初年度では、研究実施計画に沿って研究調査を進め、以下のような成果が得られた。 まず、研究の準備として、研究を効率的に遂行するため、訳語選択・対訳パターンの自動獲得を中心とした関連技術に対するサーベイを行い、各手法を比較検討した。また、英語表現の生成に必要な大規模英語データの収集及び選別を行い、約900万文の大規模で高品質な英語コーパスが得られた。次に、本研究に関連する要素技術として、機械翻訳システムの性能評価と英語学習者の英語能力推定に関する研究と日英モダリティ翻訳に関する研究を行った。また、提案システムの中核をなす構成要素として、大規模高品質英語コーパスを対象とした、単語列だけでなく品詞やワイルドカードなどを用いた検索も可能な柔軟で高速な検索を可能とする検索システムと超大規模なWebデータも利用可能にするためにWebエンジンを利用する検索プログラムを開発するとともに、訳語選択にもっとも重要な検索クエリの構成方法(文脈可変手法やルールベース手法など)の提案も行った。最後に、上記諸研究成果をベースに、日英混在文を入力とした、日英辞書と検索システムから構成される基本システムを試作した。
|