研究課題/領域番号 |
24700136
|
研究種目 |
若手研究(B)
|
研究機関 | 国立情報学研究所 |
研究代表者 |
松崎 拓也 国立情報学研究所, 社会共有知研究センター, 特任准教授 (40463872)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 機械翻訳 / 意味解析 |
研究概要 |
1. 日英翻訳システムの基礎となる日本語CCG文法の開発を進めた。この文法は広範囲のジャンルの文に対し、受身・使役といった格交代の現象や、種々の連体修飾、また複雑な並列構造など、様々な構文を一貫した方法で解析し、述語項構造レベルの深い意味構造を出力するものであり、今後、本研究での日本語文の意味構造・統語構造から翻訳対象言語への翻訳ルールを獲得するための基盤となると同時に、機械翻訳に限らない種々の応用が期待されるものである。 2. 構文アノテーション付き対訳コーパスの開発を行った。このコーパスは、英語構文解析の研究において標準的に用いられている PennTreebank コーパスの Wall Street Journal 部分の対訳データに対し、構文アノテーションおよび名詞間のアラインメントを付加したものである。対訳コーパスの両言語に構文アノテーションが付加されたデータはほとんど例が無く、今後、本研究で観察用および評価用データとして必須となる。 3. 日本語の意味解析に関する研究を行った。この研究では与えられたテキストに対する適切な意味構造が比較的明確である数学テキストを対象とし、深い意味解析を行うための基盤である意味導出の理論的枠組みについて検討を行った。スコープ曖昧性の解決など、意味構造の細部に渡る正確な把握が正確な翻訳のための必須条件となる数学テキストは、高精度な翻訳技術開発の対象ドメインとして非常に望ましい性質を持っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
日本語CCG文法の開発、対訳・構文情報付きコーパスの整備、および意味解析手法の研究など、深い統語・意味解析を基礎とする翻訳システム開発に対する必須の予備段階にあたる研究を進めたものの、翻訳ルールの抽出までは至らなかった。この遅れは当該年度以前に完了見込みであった研究の進行状況が予想よりも遅かったことを受けたものである。
|
今後の研究の推進方策 |
当初の研究課題のうち、日本語CCGによる構文解析結果と英語HPSGによる構文解析結果の相互間の翻訳に集中し、当初の推進方策に従って研究を進める。
|
次年度の研究費の使用計画 |
必要を見込んでいた計算機環境の整備について、代替の環境が利用可能であることが判明した一方、対訳データ作成の必要性が明らかになったため、使途の変更を行った。この差額と、当初旅費などとして計上していたが不要となった額を併せた約90万円は、次年度、対訳データの追加作成に充てる。これは翻訳ルール獲得について客観的かつ信頼のおける精度評価を行うことで研究進捗の効率化を図る目的である。これ以外の研究費使用は当初計画に従い進める。
|