2006 Fiscal Year Annual Research Report
Project/Area Number |
18650057
|
Research Institution | Kobe University |
Principal Investigator |
江口 浩二 神戸大学, 自然科学研究科, 助教授 (50321576)
|
Keywords | 情報検索 / クエリ構造化 / クエリ拡張 / 語間依存性モデル / マルコフランダム場モデル / グラフィカルモデル / 適合モデル / 確率的言語モデル |
Research Abstract |
今年度は、語間依存性と関連性を考慮した検索クエリ構築手法について検討した。日本語をはじめとするいくつかの東アジア言語の特徴の一つに、複合語が頻出することが挙げられる。これは日本語に対する情報検索を難しくする要因の一つとなっている。また、日本語に限らず一般に、情報検索の難しさの要因として、同義語や多義語の存在が挙げられる。 そこで、まず、クエリを構成する個々の複合語や連語における構成語間のより緊密な依存関係、並びに、単語や複合語・連語間のより緩やかな依存関係に着目したクエリ構造化手法を開発した。これは従来手法のようにあらゆる語と語が互いに独立であるという非現実的な仮定によらず、マルコフランダム場モデルによってクエリの構成語の隣接関係を利用し、クエリを自動的に構造化する。JPドメインのウェブコンテンツからなるテストコレクションを利用して、上述の語間依存性モデルによるクエリ構造化手法の有効性を実証した。 さらに、以上のようにして得られた構造化クエリを用いた検索結果から、適合モデルを構築する方式について検討した。適合モデルは確率的言語モデルの枠組みによってクエリ拡張を実現する技法である。語間依存性モデルと適合モデルを組合せることで、複合語の問題だけでなく、同義語や多義語が引き起こす問題をも緩和できる。上述のテストコレクションを用いた評価実験を行うことで、当該方式における各種パラメータの影響を分析するとともに、有効性を評価した。
|
Research Products
(3 results)