2022 Fiscal Year Annual Research Report
日英・英日パラレルコーパスの整備と検索システムの開発およびその活用法
Project/Area Number |
20K00692
|
Research Institution | Kobe Gakuin University |
Principal Investigator |
仁科 恭徳 神戸学院大学, グローバル・コミュニケーション学部, 教授 (00572778)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | パラレルコーパス / レキシカルプロファイラー / ツール開発 / 翻訳ユニット / 日英・英日翻訳 / コーパス言語学 / 翻訳コーパス / 辞書編纂 |
Outline of Annual Research Achievements |
まず、最終年度に実施した研究の成果については、以下のとおりである。 1. Ver.1.2のインターフェースのフロントページ、およびユーザーガイドの英語版を作成し公開した。また、現在までの国内外のパラレルコーパス研究、自身のパラレルコーパス研究、本ツール開発の軌跡と今後の展望などの研究成果をモノグラフ(単著)として書籍化し出版した。 2. Ver. 2.0以降で搭載を予定している日英・英日パラレルコーパスの先行調査と、そのうち有償コーパスについては担当機関や業者等と話し合いの場を設けて、今後のツール開発の方向性を探った。また、専門家と本ツールの機能面について意見交換を行い、現時点で何が実現可能であるのかを再確認した。そして、学会や講演会などで、本ツールの紹介・周知を行った。 次に、研究期間全体を通じて実施した研究の成果については、以下のとおりである。 1. 2000年以降に発表・公開された13種前後の日英・英日パラレルコーパスのうち、無償で公開されている9種の既存のコーパスについて、アラインメント、フォーマット、保存形式などを統一し、串刺し検索できるように整備した。また、重複が見られるノイズ等についても削除した。出来上がったコーパスは複数のジャンルから構成される英語・日本語それぞれ4000万語を切る程度の規模を誇るパラレルコーパスである。 2. これら整備した9種の日英・英日パラレルコーパスを瞬時に詳細に検索できるLWP(Lago Word Profiler)の改良版を開発した。Ver.1.0, 1.1, 1.2では、日本語から英語の翻訳方向で検索できるシステムを開発した。起点言語となる日本語のパターン検索機能、コロケーション抽出機能、用例+対訳の表示機能などを搭載し、ジャンル別の用例数も表示を可能にした。また、コロケーション抽出機能については5種の統計値が扱えるように配慮した。
|
Research Products
(8 results)