2006 Fiscal Year Annual Research Report
Project/Area Number |
17300043
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
佐藤 泰介 東京工業大学, 大学院情報理工学研究科, 教授 (90272690)
|
Co-Investigator(Kenkyū-buntansha) |
亀谷 由隆 東京工業大学, 大学院情報理工学研究科, 助手 (60361789)
|
Keywords | 機械学習 / 情報基礎 / 統計数学 / 情報システム / 人工知能 |
Research Abstract |
Prismは将棋の戦略や文章の比喩理解といった複雑な確率事象の分布を表現し、また分布に含まれるパラメータをデータから学習するための世界的に見てもユニークなプログラミング言語である。一方論理ベースであるため、高い記述力を備えているものの、言語の能力を発揮させるためには大量のメモリと高速のCPUが必要である。本年度はPrismの問題点を探り、改良を行った。 (1)Prismの学習は、EMアルゴリズムを使った最尤(MAP)推定であるが、巨大データからの学習に於いては、データがメモリに入りきらずスワップされる場合、極端に計算時間が掛かる問題点があった。この問題に対処するため、グリッド計算機を利用し、データをグリッド計算機の単位プロセッサに分散して処理する方式を開発した。 (2)統計的自然言語処理などの分野では、標準問題やデータを設定し、各種アルゴリズムの性能を比較する事が良く行われるが、Prismも標準的データで他のシステムとの性能比較を行う必要がある。一方近年Prismと良く似た言語としてDynaと呼ばれる言語の開発・実装が米国で続けられている。Dynaは統計的自然言語処理の分野でダイナミックプログラミングを実現する為のC++に基づく言語であり、Prismより低レベルなので、高速の実行が可能である。我々はPrismとDynaをPenn tree bankを用いたPCFGの構文解析実験により比較し、Prismが数倍から数十倍速く解析できることを確認した。 (3)現在確率的情報処理ではベイジアンネットと呼ばれるグラフィカルモデルが有力である。Prismで使われている確率計算方式がベイジアンネットの確率計算で標準的に使われている信念伝播(BP)法の一般化であることを理論的に証明した。同時に標準データにより最新のベイジアンネットの確率計算方式とPrismの確率計算方式を比べたところ、数倍の範囲でPrismの実効速度が遅いことが判明した。
|
Research Products
(6 results)