研究課題/領域番号 |
18500194
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報図書館学・人文社会情報学
|
研究機関 | 大阪大学 |
研究代表者 |
養老 真一 大阪大学, 法学研究科, 准教授 (30240831)
|
研究期間 (年度) |
2006 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
3,930千円 (直接経費: 3,600千円、間接経費: 330千円)
2007年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2006年度: 2,500千円 (直接経費: 2,500千円)
|
キーワード | 法情報 / 自動分類 / 機械学習 / SVM |
研究概要 |
インターネット上で検索エンジンを利用すれば多くの法情報が得られるが、そこには多くの不要な情報(ノイズ)が含まれているのが現状である。これらから法情報のみを取り出し、さらに自動的にカテゴリーに分類し提供できれば、利用者の検索効率を上げることができるであろう。本研究では、Support Vector Machine(以下、SVM)と呼ばれる手法を使ってコンピュータによる法情報の自動分類を試み、これが効率的な法情報検索を支援する手段として利用できないか、検討した。 まず、平成18年度において、研究に必要な実験を行うためのシステムの開発を行った。このシステムは分類さた、学習用のデータを用意しておけば、形態素解析、文書ベクトルの生成、SVMによる学習までを自動的に行う。学習結果に基づいて、文書が適切に分類されるかどうかについても、別途、判別用のデータを用意しておけば、学習結果に基づいて正解率を自動的に計算する。 平成19年度は、実際に法情報の自動分類の実験を行なった。その結果は以下のとおりである。まず、一般の法情報以外の情報と法情報の分類実験をおこなった。具体的には一般の情報のサンプルとして新聞記事のデータを、法情報として判例や法令の情報を収集して実験をおこなった。その結果、かなりの精度で一般情報と法情報を分類することができた。この結果はインターネットから法情報のみを選択的に収集する可能性を開くものである。
|