2004 Fiscal Year Annual Research Report
Project/Area Number |
15652022
|
Research Institution | Osaka University of Foreign Studies |
Principal Investigator |
森 茂男 大阪外国語大学, 外国語学部, 教授 (40273734)
|
Co-Investigator(Kenkyū-buntansha) |
藤元 優子 大阪外国語大学, 外国語学部, 助教授 (40152590)
竹原 新 大阪外国語大学, 外国語学部, 助教授 (20324874)
|
Keywords | ペルシア文学 / イラン / Unicode / XML / コーパス / ルーミー / 精神的マスナヴィー / データベース |
Research Abstract |
平成16年度は、前年度に作成したルーミー著『精神的マスナヴィー』の全文をXMLデータ化し、Web上で公開した。その上で、このデータをPerlと組み合わせ、Webブラウザ上で使用できる検索システムを作成した。さらに、この検索システムを活用し、実際に古典文学論への応用研究を行った。同時に、次年度の作業の準備として、単語単位での品詞分解の作業を開始した。 具体的には以下のように作業を行った。なお、研究代表者(森茂男)の統括の下、各研究分担者が指示を与え、ペルシア語の専門知識を有する研究補助者がデータ入力作業を行った。 1.資料の行単位での整形と公開 ルーミー著『精神的マスナヴィー』の全文(原文で約1100ページ)を文単位でXMLデータ化した。XSLを用いたWebブラウザ表示による公開と3で述べる検索システムの双方で利用するために同一の形式となるように工夫した。作成したXMLデータを本研究課題の成果としてインターネット上で公開した。次のサイトで公開されている。≪参考URL≫http://homewww.osaka-gaidai.ac.jp/%7Epersian/tapcl_jpn.html 2.単語単位での品詞分解と外部辞書の作成 次年度に作成する予定の単語単位での検索システムの予備的作業として、単語単位での品詞分解を行った。マクロプログラムを用いて作業効率化を図っている。この過程の17%の作業を今年度に終えた。この作業過程で得られる単語の出現頻度情報や品詞情報は外部辞書作成のための基礎データである。 3.文字列検索システムの開発 作成したXMLデータの全文をペルシア文字で検索するためのシステムを開発した。複数のXMLデータファイルを読み込み、検索語のみを抜き出し、HTML形式で表示させることができる。プログラムの基幹部分はXMLとXSLで作成し、入力と結果表示のためにPerlを用いた。 4.応用研究の試行と検証 実際の応用研究として、この検索システムを活用し、研究代表者(森)が論文「CHARKHの意味の変遷-マスナヴィーから始めて-」を執筆した。(3月公表予定)
|
Research Products
(1 results)