2006 Fiscal Year Annual Research Report
東アジア諸言語の「電子化グロッサリー」構築と親近関係に関するデータマイニング
Project/Area Number |
18652039
|
Research Institution | Osaka University |
Principal Investigator |
緒方 典裕 大阪大学, 言語文化研究科, 助教授 (10314410)
|
Keywords | 電子化グロッサリー / glossary mining / formal cultural ontology / 型理論 / 関数プログラミング言語 / Objective Cam1 |
Research Abstract |
本年度は、「電子化グロッサリー」構築のための予備研究・実験及び、オントロジー構築の基礎研究とその関数プログラミング言語Objective Cam1による実装を行った。「電子化グロッサリー」構築のための予備研究・実験とは、実際のグロッサリーの元となる東アジア諸言語の書籍の購入や複写による収集と、スキャナーを多言語OCRソフトの購入によって、実際にいくつかの言語の出しか作業を試み、また、一方で、IPAを含む多言語使用環境をUnicode (UTF-8)を元に構築した。オントロジー構築とは、Swadeshなどの言語リストによる語義の定義の不備から、各エスニック・グループとその文化に基づいた概念体系の形式仕様で、言語学・人類学・民族学・考古学などの研究者間の知識共有のための枠組みとして「Formal Cultural Ontology」をMorayscikの「Aitia Scheme」やPustejovskyの「Qualia構造」など語義の形式仕様を拡張し、文化の側面を導入できるように、また、多様な研鑽・演算が可能なのうに型理論に基づき、関数プログラミング言語Objective Cam1で「qualia」、「culture」、「ethnicGroup」という型とその操作関数をいくつか実装した。特に「Formal Cultural Ontology」とそれに基づいた言語の親近関係に関するデータマイニングである「glossary mining」に関する研究発表を、人工知能学会「ことば工学研究会」、The First International Workshop on Intercultural Collaboration (IWIC2007)という国際会議で発表した。
|