2021 Fiscal Year Research-status Report
日英・英日パラレルコーパスの整備と検索システムの開発およびその活用法
Project/Area Number |
20K00692
|
Research Institution | Kobe Gakuin University |
Principal Investigator |
仁科 恭徳 神戸学院大学, グローバル・コミュニケーション学部, 教授 (00572778)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | パラレルコーパス / コーパス検索ツール / ワードプロファイラー / 日英翻訳 |
Outline of Annual Research Achievements |
昨年度に引き続き、日英・英日パラレルコーパスのオンライン検索ツール『パラレルリンク』に搭載予定のコーパスの整備を実施した。一部言語データが重複している箇所に関しては、削除するなどして、より信頼性のあるコーパス整備に努めた。また、インタフェースについてもプロトタイプ版を試作したが、一部問題が生じたため、既に開発済みのワードプロファイラーにコーパスデータを移行させることを検討している。現在まで、概ね、順調に研究は進んでいる。 なお、今年度の成果については、既に英語コーパス学会における学会発表「日英・英日パラレルコーパスオンライン検索ツール『(仮称)パラレルリンク』(Ver.1.0)の開発に向けて(中間報告)」を行い、論文「『パラレルリンク』(Ver.1.0)の開発-パラレルコーパス研究の概観とコーパス整備-」が機関紙に掲載される予定である。内容については、現在までに構築された日英・英日パラレルコーパス,開発されたコンコーダンサー等の検索ツール,日英・英日パラレルコーパスを活用した研究を概観し,各パラレルコーパスの翻訳方向やテクストジャンル等の特徴と問題点,および今後ニーズが高まるツールや研究について具体的に述べた後に、これからのパラレルコーパス研究の方向性を示すべく開発中の日英・英日パラレルコーパスオンライン検索ツール『パラレルリンク』(Ver.1.0)に搭載予定の9種のパラレルコーパスの概要と,それらを再整備する上で施したテキスト処理やアノテーション,全文検索インデックスの作成,ファイル整理について詳説している。インターフェースやその機能については、今後、開発終了後に学会発表等を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度の段階では、コーパスの構築・整備の進捗については少し遅れている部分もあったが、現在のところほぼ計画どおりに進んでいる。現在は、再整備したコーパスのクリーニング処理がほぼ終わり、インターフェースの試作版が完成した。インターフェース自体は試作版が完成したものの、検索機能等の点では、他のコーパス検索ツールでも既に活用実績のある旧ヴァージョンのワードプロファイラーのインターフェースの方が優れているため、今後、インターフェース間でコーパスデータの移行に取り組む予定である。
|
Strategy for Future Research Activity |
現在までの進捗状況でも述べたとおり、現在、検索面でより信頼性のある旧ヴァージョンのワードプロファイラーのインターフェースに再整備したパラレルコーパスデータを移行する予定である。移行完了後、この試作版のツールを使って、辞書学あるいは翻訳学に関する本ツールの活用研究を実施し、学会での口頭発表、論文の公開、書籍の刊行などを予定している。また、本ツールを様々なユーザーに広く使っていただきたいという目的から、今年度の秋以降に一般に無償公開する予定である。
|