2008 Fiscal Year Annual Research Report
Project/Area Number |
20500848
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
塚本 享治 Tokyo University of Technology, メディア学部, 教授 (90386764)
|
Keywords | オントロジー / RDF / OWL / Javaプログラム / ソフトウェア解析 |
Research Abstract |
既存教材よりのオントロジー構築と定量化の研究を「既存資料よりのオントロジー構築」と「オントロジーの定量化」に分け並行して研究に着手した。両者を並行して行い、後者で開発した方式で前者の定量化を行うという方針である。 「既存資料よりのオントロジー構築」に関しては、まず学部を代表する科目に関しては手作業で解析し、代表的でない多くの科目は自動解析するという方針をたて、学部全体と3つのコースを代表する科目の計4科目を選択して、そのパワーポイント教材に現れる重要用語を手作業で抽出してそれらの間の関係をRDF化した。用語間の関係を表す述語は、サ変動詞は名詞化する、否定記述を扱わない、概念の階層化を行った。一方同じパワーポイント教材から用語を自動抽出するシステムを開発した。パワーポイント教材を分解してえたXML形式のコンテンツを形態素解析するものである。手作業による分析とコンピュータによる解析を比較した結果、コンピュータによる解析を手作業による分析に近づけるには、複合語を分解して係り受けを扱う構文解析が必要なことがわかった。 「オントロジーの定量化」に関しては、定量化の方式が正しいことがわかる分野で大量のデータが入手できる必要があると判断して、Javaソフトを対象とすることとした。正しく動作することがわかっているJarファイルを逆アッセンブルした結果からクラスとクラス間の関係を抽出しRDF化した。クラス間の構造をOWLで記述し、OWLによる推論を行ってJavaクラス問の関係の検索が可能なシステムを開発した。このシステムを使って、Javaで実現されたRDBシステムとアプリケーションサーバシステム計4種類の解析を行った。その結果、これまでわからなかったJavaクラス間の構造関係が発見できた。また、クラス数2000で推論時間が37分、推論時間はn2乗オーダであることが実験的に分かった。
|