2006 Fiscal Year Annual Research Report
Project/Area Number |
18500194
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Osaka University |
Principal Investigator |
養老 真一 大阪大学, 法学研究科, 助教授 (30240831)
|
Keywords | 法情報 / 自動分類 / 機械学習 / SVM |
Research Abstract |
インターネット上で検索エンジンを利用すれば多くの法情報が得られるが、そこには多くの不要な情報が含まれている。この研究はこれらを何らかのカテゴリに自動的に分類し提供することで、利用者の検索効率を上げるとを目的としている。具体的にはSupport Vector Machine(以後SVM)と呼ばれる、機械学習による自動分類アルゴリズムを用いた文書分類法が、法情報に適用できるかどうかの研究を行っている。 SVMは本来、情報を二つのカテゴリに分類する手法である。これまではSVMを使って情報を法情報とそうでない情報にわける研究を行い、また、研究に必要な実験を行うためのシステムの開発を行ってきた。今年度は特にSVMを三つ以上のカテゴリに分類する実験をおこなうためのシステムの開発を行った。 このシステムは分類された、学習用のデータを用意しておけば、形態素解析、文書ベクトルの生成、SVMによる学習までを自動的に行う。学習結果に基づいて、文書が適切に分類されるかどうかについても、別途、判別用のデータを用意しておけば、学習結果に基づいて正解率を自動的に計算する。 SVMの本体エンジンはTinySVMとlibSVMを切り替えて使用できるようになっている(3つ以上のカテゴリ分類はlibSVMのみ)さらに文書ベクトルを生成するための形態素を、特定の品詞にかぎるなど、実験に便利なオプションが指定できるようになっている。また、文書ベクトルからもとの文書を簡単に検索できるような機能をもっており、実験結果の解析が効率的に行えるような仕組みをくみこんである。
|
Research Products
(2 results)
-
-
[Book] 法情報学(第2版補訂版)2006
Author(s)
加賀山茂, 松浦好治, 門昇, 田中規久雄, 養老真一
Total Pages
298
Publisher
有斐閣
Description
「研究成果報告書概要(和文)」より