平成17年度は前年度に作成したイラン口承文芸資料の文単位でのXMLデータをさらに細かく整形した。さらにこれを利用してより精度の高い検索システムを作成し、意味属性と語源による分析を行った。 具体的には、下記の1から4に示した方法で行った。なお、データ入力や単純な作業についてはペルシア語の専門知識を持つ研究補助者を活用した。 1.品詞分解の精査:昨年度までに、自動タグ付けマクロなどによって整形した単語単位でのイラン口承文芸に関するXMLデータについて、すでに精査の終わった「笑い話と小話」を除いた「動物寓話」、「本格昔話」、「形式譚」、「伝説」、「現代伝説」、「伝承遊戯」、「歌謡」、「民間信仰」のデータを精査した。この作業においてはペルシア語の専門知識を有する補助者を効果的に活用した。 2.外部辞書の拡充:昨年度までに、扱う口承文芸資料内に出現する単語についての外部辞書に、意味属性データを付与した。この作業により、外部辞書には語義、語源、品詞に関する情報に加え、意味属性が付加されたことになった。1で精査したXMLデータは単語単位で外部辞書にリンクされているため、これらのデータを使って複合検索ができるようになった。膨大なデータを扱ったため、1と同様にペルシア語の知識を有する補助者を活用した。 3.検索システムの改良:1および2において精査した単語単位のXML及びデータおよび作成した外部辞書データを民俗学研究に応用させるための検索システムの改良を行った。 4.応用研究:上記1から3の作業において精査および作成されたデーダと検索システムを用いて、民話学の立場からの研究を、語源と意味属性の複合検索により、特定の意味属性をもつ単語の語源による割合を抽出し、意味属性ごとの違いを明らかにすることで行った。
|