WWWのオンラインマニュアル化による知識検索

Publicly Offered Research

Project Area	Cyber Infrastructure for the Information-explosion Era
Project/Area Number	21013003
Research Category	Grant-in-Aid for Scientific Research on Priority Areas
Allocation Type	Single-year Grants
Review Section	Science and Engineering
Research Institution	Tokyo Institute of Technology
Principal Investigator	藤井敦東京工業大学, 大学院・情報理工学研究科, 准教授 (30302433)
Project Period (FY)	2009 – 2010
Project Status	Completed (Fiscal Year 2010)
Budget Amount *help	¥5,000,000 (Direct Cost: ¥5,000,000) Fiscal Year 2010: ¥2,500,000 (Direct Cost: ¥2,500,000) Fiscal Year 2009: ¥2,500,000 (Direct Cost: ¥2,500,000)
Keywords	WWW / 知識検索 / 意見分析 / 情報検索 / 情報爆発 / 評判情報 / 隠語 / 自然言語処理 / 事典 / Wikipedia
Research Abstract	近年,World Wide Web上の検索エンジンを使って様々な調べ物や捜し物をすることが日常的になっている.しかし,Webには統制がないため,必要な情報だけを選別し,複数の情報を結び付けて解を見出す作業はユーザにゆだねられている.この問題を解消するために,既存の情報検索を超える知識検索の技術について研究を行った.本研究が目指す知識検索とは,Webに潜在するにも拘らず,キーワードやカテゴリでは見つけることが難しい「人々の知識や考え」を取り出す作業である. 2010年度は,企業や商品などの評判情報をWebから効率よく検索する手法について研究した.本研究の特長は,Web上の評判情報では「隠語」が使われることが多いことに着目した点にある.本研究は,評判を検索する対象の事物(企業名など)から,人間が考えそうな隠語を自動生成し,その隠語集合を用いてWebを検索する.そのため,隠語が造られるパターンを類型化し,隠語生成を自動化した.しかし,隠語の自動生成は完璧ではなく,人間が使用しないような無意味な文字列が隠語の候補として生成される場合がある.その結果,評判情報の検索精度が低下するといった問題が生じてしまう.この問題を解消するために,正式名称と各隠語候補が出現する文脈を分析し,正式名称と同じような文脈に出現する隠語候補には高いスコアを与える手法を提案した.具体的には,正式名称や隠語候補の周辺に出現する単語の集合を「文脈」としてモデル化し,自然言語処理の分野で開発された文脈類似度によって,各隠語候補のスコアを計算した.評価実験の結果,隠語候補のスコアを計算し,上位の隠語候補だけを用いてWebを検索することによって,評判情報の検索精度を向上させることに成功した.

Report

(2 results)

2010 Annual Research Report
2009 Annual Research Report

Research Products
(8 results)

All 2011 2010 2009

All Journal Article (6 results) (of which Peer Reviewed: 6 results) Presentation (2 results)

[Journal Article] アンカーテキストモデルと検索質問分類によるWeb文書検索の高度化2010
- Author(s)
  藤井敦
- Journal Title
  
  情報処理学会論文誌
  
  Volume: 51(12) Pages: 2330-2342
- NAID
  110007970832
- Related Report
  2010 Annual Research Report
- Peer Reviewed
[Journal Article] Question Answering for the Operation of Software Applications : A Document Retrieval Approach2010
- Author(s)
  Atsushi Fujii, Seiji Takegata
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: E93-D(6) Pages: 1369-1377
- NAID
  10027987466
- Related Report
  2010 Annual Research Report
- Peer Reviewed
[Journal Article] 中国語への翻字における関連語抽出の応用2010
- Author(s)
  黄海湘, 藤井敦
- Journal Title
  
  自然言語処理
  
  Volume: 17(2) Pages: 3-24
- NAID
  10027016194
- Related Report
  2010 Annual Research Report
- Peer Reviewed
[Journal Article] Modeling Slang-style Word Formation for Retrieving Evaluative Information2009
- Author(s)
  藤井敦
- Journal Title
  
  Proceedings of Conference of the Pacific Association for Computational Linguistics
  
  Pages: 290-295
- Related Report
  2009 Annual Research Report
- Peer Reviewed
[Journal Article] A Lemmatization Method for Mongolian and its Application to Indexing for Information Retrieval2009
- Author(s)
  Badam-Osor Khaltar, Atsushi Fujii
- Journal Title
  
  Information Processing & Management 45(4)
  
  Pages: 438-451
- Related Report
  2009 Annual Research Report
- Peer Reviewed
[Journal Article] 栄養素等摂取バランスを考慮した料理レシピ検索システム2009
- Author(s)
  苅米志帆乃, 藤井敦
- Journal Title
  
  電子情報通信学会論文誌 J92-D(7)
  
  Pages: 975-983
- NAID
  110007331956
- Related Report
  2009 Annual Research Report
- Peer Reviewed
[Presentation] 評判情報の検索における隠語の生成と順位付け2011
- Author(s)
  太田裕貴, 藤井敦
- Organizer
  言語処理学会第17回年次大会
- Place of Presentation
  豊橋市
- Year and Date
  2011-03-10
- Related Report
  2010 Annual Research Report
[Presentation] 意見マイニングを志向したQAサイト投稿テキストの解析2010
- Author(s)
  井上結衣, 藤井敦
- Organizer
  第2回データ工学と情報マネジメントに関するフォーラム
- Place of Presentation
  兵庫県淡路市
- Year and Date
  2010-03-01
- Related Report
  2009 Annual Research Report

WWWのオンラインマニュアル化による知識検索

Principal Investigator

藤井 敦 東京工業大学, 大学院・情報理工学研究科, 准教授 (30302433)

¥5,000,000 (Direct Cost: ¥5,000,000)

Report

Research Products

[Journal Article] アンカーテキストモデルと検索質問分類によるWeb文書検索の高度化2010

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Question Answering for the Operation of Software Applications : A Document Retrieval Approach2010

Author(s)

Journal Title

NAID

Related Report

[Journal Article] 中国語への翻字における関連語抽出の応用2010

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Modeling Slang-style Word Formation for Retrieving Evaluative Information2009

Author(s)

Journal Title

Related Report

[Journal Article] A Lemmatization Method for Mongolian and its Application to Indexing for Information Retrieval2009

Author(s)

Journal Title

Related Report

[Journal Article] 栄養素等摂取バランスを考慮した料理レシピ検索システム2009

Author(s)

Journal Title

NAID

Related Report

[Presentation] 評判情報の検索における隠語の生成と順位付け2011

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 意見マイニングを志向したQAサイト投稿テキストの解析2010

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

藤井敦東京工業大学, 大学院・情報理工学研究科, 准教授 (30302433)