研究課題/領域番号 |
24500281
|
研究機関 | 慶應義塾大学 |
研究代表者 |
萩原 将文 慶應義塾大学, 理工学部, 教授 (80198655)
|
研究期間 (年度) |
2012-04-01 – 2016-03-31
|
キーワード | ニューラルネットワーク / 知識処理 |
研究実績の概要 |
昨年度構築した概念ネットワークと時系列ネットワークの2 つのネットワークから構成されるニューラルネットワークでは、膨大な知識を扱うための知識層がまだ不十分であることが問題点としてあった。そこで今年度は、ニューラルネットワーク型概念ネットワークを自動的に構築する研究を重点的に行った。その結果として、日本語WordNetにおける語(word) と概念(synset)、及びそれらの関係を基に繋がりの強さ(結合荷重) を有する概念ネットワークを構築した。具体的には、語と概念間では日本語WordNet のリンクをそのまま利用し、ニューラルネットワークとするために結合荷重の自動的な付与を行った。概念と概念間に関しては新たに結合荷重を有するリンクを生成した。さらに、コーパスを用いた構築手法と 共起辞書を用いた構築手法の2つの手法を考案し、それぞれから得られたネットワークの統合を行った。最終的に構築されたニューラルネットワーク型概念ネットワークにおける概念数は35,126(日本語WordNetでは57,238)、リンク数は142,573(日本語WordNetでは158,058)、単語数は72,305(日本語WordNetでは93,834)であり、日本語WordNetにほぼ匹敵するものとなっている。しかしながら実際にニューラルネットワークとして統合し実験を行ってみると、実世界での応用を考慮すると、これでもまだ不十分であることが判明した。そこで現在、複数の言語資源を統合するというアイデアの着想により、概念数を大幅に増やし、膨大な知識の扱いに耐えられるようなニューラルネットワーク型概念ネットワーク生成の研究を継続して行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究は膨大な知識を有し、優れた思考機能を持つニューラルネットワーク型の自然言語処理システムの構築である。特に膨大な知識を扱うための知識層の構築に予想外の時間がかかっている。一度構築したニューラルネットワーク型概念ネットワークでは、実世界での応用を考慮すると、これでもまだ不十分であることが実験により判明した。そこで現在、より多くの知識を扱える方式の研究を行っている。
|
今後の研究の推進方策 |
平成26年度においては、これまでの研究成果を集大成し、ニューラルネットワーク型自然言語処理システムとして完成させることが目標であった。しかしながら、本システムにおいて最も重要な膨大な知識を扱うための知識層に求められる仕様のレベルが非常に高いものであることが、実験により明らかになった。そこで、複数の言語資源を統合するというアイデアの着想を得、概念数を大幅に増やし、膨大な知識の扱いに耐えられるようなニューラルネットワーク型概念ネットワーク生成の研究を続行している。
|
次年度使用額が生じた理由 |
本研究は膨大な知識を有し、優れた思考機能を持つニューラルネットワーク型の自然言語処理システムの構築である。特に複数言語資源の統合的活用において、各言語資源の細部での表現形式の相違点は多い。各言語資源のデータは膨大量であり、手作業での統合は事実上不可能である。統合を自動的に行う必要があるが、その方式の考案・構築に予想外の時間がかかっている。その結果、膨大量の知識を表現するための研究に遅れが生じ、そのための機器購入、プログラム作成等の支出額が予定を下回った。現在、言語資源に信頼度の差を設ける方法を考案しており、本アイデアにより遅れを取り戻し、成果につなげる見込みが得られている。
|
次年度使用額の使用計画 |
2015年度は早急に、複数言語資源に信頼度の差を設けるというアイデアに基づき、膨大なデータ量を有する複数言語資源の統合部のプログラムを完成させる(謝金予算:約220,000円)。同時に、高性能コンピュータ(予算:約180,000円)を購入し評価実験を行う。さらに最終年度で得られた成果をもとに学会での成果発表を行う(予算:約150,000円)。
|