2003 Fiscal Year Annual Research Report
Project/Area Number |
15652022
|
Research Institution | Osaka University of Foreign Studies |
Principal Investigator |
森 茂男 大阪外国語大学, 外国語学部, 教授 (40273734)
|
Co-Investigator(Kenkyū-buntansha) |
竹原 新 大阪外国語大学, 外国語学部, 助教授 (20324874)
藤元 優子 大阪外国語大学, 外国語学部, 助教授 (40152590)
|
Keywords | ペルシア文学 / イラン / unicode / xml / コーパス / ルーミー / 精神的マスナヴィー / データベース |
Research Abstract |
これまで、コンピュータ上でのペルシア語の処理は一般的なOS間で文字符号の互換性がなく、表示や入力においても問題があったが、世界標準となりつつあるUnicodeを用いることにより、問題がほぼ解消し、ペルシア語による汎用性のあるコーパスデータの作成が可能になった.。 そこで、萌芽的且つ実験的な試みとしてイランを民族の精神文化の根幹であり、且つ、イラン地域文化学全般においても不可欠な文献であるルーミー著『精神的マスナヴィー(Masnavi-ye ma' anavi)』の全文をUnicode方式に基づいてペルシア文字でプレーンテキスト化した。さらに、このデータの整形し、一部を公開した。これにより、次年度以降に予定しているXML形式による本格的なデータベース作成の基礎ができた。 平成15年度は、下の方法で研究を遂行した。なお、研究代表者(森茂男)の統括の下、各研究分担者が指示を与え、ペルシア語の専門知識を有する研究補助者がデータ入力作業を行った。 1.コーパス作成方法の策定 研究代表者および研究分担者の合意により、利用目的に合ったコーパスの作成の詳細な手順と方法を策定した。 2.資料のテキスト化 上記1に基づき、13世紀にルーミーによって書かれた『精神的マスナヴィー』の全文(原文で約1100ページ)をUnicode方式に基づいてペルシア文字でプレーンテキスト化した。まだ、修正が必要な部分もあるが、コンピュータを新規に2台導入したことにより、入力作業は効率よく行われ、情報整理も円滑に行われた。 3.コーパスデータの公開 作成されたプレーンコーパスデータをHTML化し、WEB上での公開を開始した。現段階における公開率は全データの17%である。
|