研究課題/領域番号 |
26330365
|
研究機関 | 和歌山大学 |
研究代表者 |
村川 猛彦(田中猛彦) 和歌山大学, システム工学部, 准教授 (90304154)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 情報検索 / 全文検索 / 検索エンジン / 自然言語処理 / 行動特性 |
研究実績の概要 |
利用者にとって使いやすく,提供者は分析・改良が可能な全文検索サービスの開発および提供を行うための足がかりとして,平成26年度は主に,(1)全文検索エンジン比較,(2)検索行動特性,についてシステム構築および評価を実施した. (1)全文検索エンジン比較においては,Apache Solrの5つのバージョン(1.4.1,3.1.0,3.6.2,4.6.0,4.9.0)を対象とし,1台の計算機上で,設定ファイルの必要最小限な修正を行ってから同時に起動させ,共通の文書群に対してバージョンごとにインデックスを構築して,同一の検索語をコマンドラインで与えれば,それに対する該当文書数を求める環境を構築した.その結果,バージョンごとの該当文書数の異同を発見するなどの知見が得られた.検索語に「室町」と「室町時代」を与えたときの該当文書数の違いから,トークナイザごとの挙動が文書検索に大きく影響していることを確認した. (2)検索行動特性においては,いったん検索対象文書群を1台の計算機に格納し,OS・ブラウザ・ビューアの検索機能を利用して(外部通信をすることなく)検索を行う実験を実施した.先行研究と同様に,検索課題にはクローズドタスクとオープンタスクの2種類を用意した.結果として,以前に参照した際の記憶をもとに効率良く絞り込みを行うことや,タスク間の情報収集方略の違いが小さかったことなど,インターネット検索とは異なる行動特性を知ることができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
実施計画に掲げた,(1)全文検索エンジン比較,(2)検索行動特性,のそれぞれについて,環境を構築し,評価および実験を行うことができた.研究実績の概要で述べた通り,(1)全文検索エンジン比較では,バージョンごとの該当文書数の異同を確認し,その原因となる処理を知ることができた.また(2)検索行動特性では,インターネット検索とは異なる特性を確認することができた.これらについては学会発表などで成果公表を行ってきた.また一般向けイベントの出展を通して研究内容を市民に伝えることも行ってきた.得られた知見をもとに,研究実施計画のとおり「全文検索サービスの提供を支援するシステム」の開発に速やかに取りかかれる状況となっている.
|
今後の研究の推進方策 |
平成26年度の成果を踏まえ,平成27年度では「全文検索サービスの提供を支援するシステム」の開発を行う.システムは主に,全文検索エンジン選択部,インデックス構築部,検索インタフェース部により構成される.このうち,全文検索エンジン選択部については,平成26年度の全文検索エンジン比較の成果をもとに,選択プログラムをWebインタフェースとして開発する.インデックス構築部については,全文検索エンジンの動作をもとに構築終了時間を求める機能も開発する.検索インタフェース部では,単純なキーワード検索機能のほか,検索語や検索履歴をもとに内部の検索を変更(強化)して検索を行う機能も提供する.構築を行い,各機能および全体の動作確認をする.詳細なシステム評価(利用者評価を含む)およびシステム改良は,平成28年度に実施する.
|
次年度使用額が生じた理由 |
サーバ1台を含む物品費,旅費,人件費,その他(学会参加費)でほぼ予定通りに予算執行を行ってきたが,調整不足により若干の残額が生じた.
|
次年度使用額の使用計画 |
平成27年度の物品費(書籍など)に組み入れ,適正な予算執行を行っていく.
|
備考 |
和歌山大学で2014年11月23日に開催された公開体験学習会で出展し,市民との対話を通じて情報検索の研究内容など伝えた.
|