2012 Fiscal Year Research-status Report
Project/Area Number |
23700116
|
Research Institution | Kyoto University |
Principal Investigator |
浅野 泰仁 京都大学, 情報学研究科, 准教授 (20361157)
|
Keywords | 集合知 / ウェブ / 知識補完 |
Research Abstract |
平成24年度は,(A)Wikipediaに足りない知識をウェブから自動的に取得して補完する方法,および(B)Wikipediaとウェブ双方の情報を用いてクラシック音楽の内容説明を自動的に検索する方法, (C)Wikipedia上の歴史的事象に関する知識を「事象グラフモデル」を用いて整理する手法,そして(D) 画像に関する集合知と呼べるflickrに存在する画像のタグの品質を向上させる手法,を構築した.(A)(B)ではともに計画に示したトピックモデルとしてLDAを用いている.(A)ではLDAを用いてWikipediaとウェブ上に存在する知識の差異をモデル化している.(B)では,独自の調査の結果,クラシック音楽に関するウェブページの検索結果が,内容説明などの合計8クラスに分類されることを確かめ,LDAの発展であるLabeled LDAを適用することで,内容説明が含まれるページを見つけている.(C)では,事象に関する記述に様々な粒度が存在し,またその記述間の関係が事象の構成に重要であることを発見し,それを表すために極小の事象記述を点とし,それらの間の関係を因果・逆説を含む8種類で表す事象グラフモデルを提案した.さらに,談話構造解析などの自然言語処理技術を活用して,Wikipediaのページから事象グラフを構築する手法を提案した.(D)では,タグと画像の間の関係を表すグラフモデルを構築し,反復改良原理を用いたアルゴリズムによって画像にとって良いタグを推定している.また,(A)-(D)すべてについて,複数の事例(これは(A)の場合は,Wikipediaの項目に相当する概念であり,(B)は楽曲, (C)は歴史上の人物,(D)は画像に相当する)を用いた実験を行い,有効性を示した成果を国際学会または論文誌に投稿し,採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
基本的には交付申請書に記載した研究の目的に沿う結果が得られている.提示手法については,「関係」を説明する画像を検索・提示する「縁」システム以外に構築できていないが,申請書には当初記載していなかった,様々な種類の集合知に関する知識検索・補完手法が構築できている.
|
Strategy for Future Research Activity |
(1) 「研究実績の概要」(B)をさらに発展させ,クラシック音楽のどの楽曲部分にどの内容説明が対応するかを自動的に求めて,音楽の再生と同時にその内容説明を提示する手法を構築する. (2) 「研究実績の概要」(C)をさらに発展させ,記述は似通っているが構造が異なる事象や,単語や順序が似ていない記述であっても事象としての構造が似ているものなどを自動的に検索する手法を構築する. (3) 「研究実績の概要」に記されていない集合知として,(Amazon, 食べログなどに代表される)オンラインレビューがよく利用されている,近年ステマなどが問題になっている.これについて,特に,早期レビューの評価が対象に関する印象に重大な影響を与えることが知られている.そこで,ある対象に関して早期レビューしかない状態でも,他の対象のレビューなどを用いて,特異なレビュアーを自動的に検出し,彼らの影響を抑えた評価サマリを求める手法を構築する.
|
Expenditure Plans for the Next FY Research Funding |
物品費として,手法を計算機上で実装するためのソフトウェア,記憶装置,図書等を購入する.また,成果を国際学会で発表し,最新の情報を入手するために,旅費を用いる.また,国際学会および論文誌への投稿の際には英文校閲を業者に依頼する.手法の性能評価実験のために,研究室の学生に評価などを行ってもらうため,謝金を用いる.
|
Research Products
(10 results)