• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

ペルシア古典文学のコーパス作成と応用研究

研究課題

研究課題/領域番号 15652022
研究機関大阪外国語大学

研究代表者

森 茂男  大阪外国語大学, 外国語学部, 教授 (40273734)

研究分担者 竹原 新  大阪外国語大学, 外国語学部, 助教授 (20324874)
藤元 優子  大阪外国語大学, 外国語学部, 助教授 (40152590)
キーワードペルシア文学 / イラン / unicode / xml / コーパス / ルーミー / 精神的マスナヴィー / データベース
研究概要

これまで、コンピュータ上でのペルシア語の処理は一般的なOS間で文字符号の互換性がなく、表示や入力においても問題があったが、世界標準となりつつあるUnicodeを用いることにより、問題がほぼ解消し、ペルシア語による汎用性のあるコーパスデータの作成が可能になった.。
そこで、萌芽的且つ実験的な試みとしてイランを民族の精神文化の根幹であり、且つ、イラン地域文化学全般においても不可欠な文献であるルーミー著『精神的マスナヴィー(Masnavi-ye ma' anavi)』の全文をUnicode方式に基づいてペルシア文字でプレーンテキスト化した。さらに、このデータの整形し、一部を公開した。これにより、次年度以降に予定しているXML形式による本格的なデータベース作成の基礎ができた。
平成15年度は、下の方法で研究を遂行した。なお、研究代表者(森茂男)の統括の下、各研究分担者が指示を与え、ペルシア語の専門知識を有する研究補助者がデータ入力作業を行った。
1.コーパス作成方法の策定
研究代表者および研究分担者の合意により、利用目的に合ったコーパスの作成の詳細な手順と方法を策定した。
2.資料のテキスト化
上記1に基づき、13世紀にルーミーによって書かれた『精神的マスナヴィー』の全文(原文で約1100ページ)をUnicode方式に基づいてペルシア文字でプレーンテキスト化した。まだ、修正が必要な部分もあるが、コンピュータを新規に2台導入したことにより、入力作業は効率よく行われ、情報整理も円滑に行われた。
3.コーパスデータの公開
作成されたプレーンコーパスデータをHTML化し、WEB上での公開を開始した。現段階における公開率は全データの17%である。

URL: 

公開日: 2005-04-18   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi