2011 Fiscal Year Research-status Report
形式概念分析によるユーザーの直観に適したウェブ検索結果の視覚化システムの開発
Project/Area Number |
23700245
|
Research Institution | University of Tsukuba |
Principal Investigator |
延原 肇 筑波大学, システム情報系, 講師 (80359687)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 情報視覚化 / 検索支援 / 形式概念分析 |
Research Abstract |
形式概念分析に基づいた検索エンジンの視覚化技術のプロトタイプをPython開発を行った.具体的なシステムのプロセスとしては,ユーザーの任意の検索クエリに対して,Yahoo APIを用いて検索結果のテキストページ群を取得する.取得後のテキストページを,eutiful Soupおよび形態素解析APIを利用することでキーワードに分割する.さらに,それらのキーワードの重要度,頻度を計量した上でWebページおよび対応するキーワード群の関係表を作成する.ここで各キーワードの重要度の計量には,篠崎らの提案している手法「リンク構造と語の共起を利用したWebページからのキーワード抽出手法とページ要約による検索支援」(第3回 楽天研究開発シンポジウム)を採用する.構成した情報表に対して形式概念分析を適用し,検索結果のwebページ群を概念構造の観点から抽象化し,ユーザーに対して咀嚼しやすいシステムを開発している. 従来の形式概念分析では,得られた概念構造が複雑になりすぎて具体的に出力された結果が何を示しているのかよくわからない,といった現象を引き起こしていたが,本研究で提案する束構造視覚化では,力学系モデルを採用し,また束構造をできるだけ保持した形で視覚化することで,この問題を解決している.本研究の成果として,国内特許出願(情報検索支援装置,特願 2012-2539)が1件,また国際会議1件,国内学会(査読つき)1件が得られている.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
国内研究会・国際会議のほか,特許の出願も完了している点
|
Strategy for Future Research Activity |
平成23年度において得られた研究成果を,テキスト以外のにマルチメディアに拡張する.具体的には,画像,映像をはじめとする膨大なデータベースから,さらにマイクロブログ,ソーシャルサービス,音楽のレコメンデーション等,はばひろい応用を目指す.
|
Expenditure Plans for the Next FY Research Funding |
平成23年度から繰越額が発生しているが,これらについては,招聘を予定していた研究者が急病のため来日できず、そのための費用を繰り越すこととなったためである. 次年度は,繰越発生分も含めて,平成23年度において得られた成果を,国際会議,雑誌論文等へ積極的に投稿する予定である.その際の旅費,論文掲載料をメインに支出する予定である.すでに平成23年度に得られた成果が雑誌論文として掲載が決まっており,それらに充当する予定である.
|