研究課題/領域番号 |
15H01721
|
研究機関 | 九州大学 |
研究代表者 |
冨浦 洋一 九州大学, システム情報科学研究院, 教授 (10217523)
|
研究分担者 |
相澤 彰子 国立情報学研究所, 大学共同利用機関等の部局等, 教授 (90222447)
難波 英嗣 広島市立大学, 情報科学研究科, 准教授 (50345378)
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | 情報検索 / 学術論文検索支援 / 専門用語 / トピック分析 / 情報要求 / 情報探索行動分析 |
研究実績の概要 |
〔情報要求に関連する論文の絞込み手法の改良〕前年度開発した手法は,検索者自身によるトピック分析結果のトピックの解釈が必要であったが,これは,検索者にとって負担となるだけでなく,その判断次第では絞込み性能が低下する.そこで今年度は,まず,検索語が含まれるトピックの解釈が容易な,トピック分析のための統計モデルの開発を試みたが,トピックの解釈容易性に関して大きな改善は見られなかった.次に,非限定的な検索語によるクエリとは別に,情報要求を端的に表す限定的な検索語によるクエリを検索者に入力させ,非限定的なクエリで収集した抄録集合のトピック分析結果を利用して,限定的なクエリをトピックの積・和で表し,これを用いたトピックベースの検索による論文絞込み手法を開発した. 〔日英の専門用語とその対訳の抽出と専門用語を用いた論文検索支援〕日本語および英語入力テキストから専門用語を抽出して対訳とともに提示するAPIを実装した.また,共通のタスクデータを用いている論文を収集し,特定のクエリに関連する文を各論文から抽出して提示する手法の開発を行い,インタラクティブな検索の観点から予備的な評価を進めた. 〔俯瞰的な調査のための論文検索における有用な情報の抽出〕ある特定分野における複数の学術論文の構造を解析し,論文間で対比的な個所を同定する技術を開発した.また,この技術を用いて、その分野における技術の経年変化を提示できるシステムを構築した. 〔論文検索の実態調査〕前年度行った観察とインタビューに基づく検索行動の分析は,多くの被験者を対象にするのは困難である.そこで,前年度の分析結果を踏まえ,各検索状況に応じて,どのようなデータベースを用いて,どのような情報を基に読むべき論文を絞り込んでいるのかを調査するためのアンケートを作成し,Web上で2つの大学の工学系の大学院の研究者と院生を対象にアンケート調査を実施した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
・情報要求に関連した論文の絞り込み手法の改良については,トピック分析の結果のトピックの解釈が不要で,前年度開発した手法より絞り込み性能も高い手法が開発できた. ・日英の専門用語とその対訳の抽出のためのAPIを開発した.また,専門用語を利用した論文検索支援についても検討が進んだ. ・ある研究領域の俯瞰的な調査のための論文検索の支援に関し,システム構築ならびに検討が進んだ. ・アンケート調査によって,研究者がどのようなデータベースを用いてどのような情報を基に読むべき論文を絞り込んでいるのかを調査できた.
|
今後の研究の推進方策 |
情報要求に関連した論文の絞り込み手法の評価は今のところ NTCIR-1, 2 のテストコレクションを用いて行っている.このデータは一つの情報要求に対して数千の抄録しか含まれていない.英語論文をScopus等のデータベースで非限定的なクエリで検索すると数十万の論文が検索結果に含まれることがある.この場合,検索結果の全書誌情報を収集するのには膨大な時間がかかり,現実的ではない.一方,多くの場合,一人の研究者が確認する論文は一定の分野だけである.そこで,雑誌名や会議名を指定して論文の書誌情報を収集しておき(定期的に最新化を図る),限定的なクエリをトピックベースのクエリに変換する今年度開発した手法により論文を絞り込むことを検討する.このための論文収集システムは今年度開発している. 専門用語を利用した論文検索支援に関しては,自動抽出した専門用語に対して,意味ベクトルを獲得して類似検索を可能にし,これに基づいた類似文献検索を行うためのデータ構築および辞書整備を行う予定である. 俯瞰的調査のための論文検索の支援に関しては,論文間の対比的な箇所の同定の精度向上を図るとともに,当該分野の技術の経年変化の他,研究課題などの経年変化も示せるシステムの開発を目指す.
|