• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

分類型検索システムの多言語対応に関する研究

研究課題

研究課題/領域番号 21700273
研究機関群馬大学

研究代表者

安川 美智子  群馬大学, 工学(系)研究科(研究院), 助教 (70361384)

研究期間 (年度) 2009-04-01 – 2013-03-31
キーワード情報検索 / 情報組織化 / 自然言語処理 / 図書館情報学 / 分類型検索 / 言語横断検索 / アクセシビリティ / ユーザビリティ
研究概要

本年度は,昨年度までに予備的検討を進めてきた日本語の発音照合の手法を改良し,オープンソースソフトウエアのデータベース管理システムPostgreSQLのユーザ定義関数として実装を行い,評価を行った.発音照合は,類似文字列検索の手法のひとつであり,文字列の綴りではなく,文字列が発音された音声の類似性に基づく検索の手法である.英語における先行研究では,文字列編集距離と発音照合を組み合わせた情報検索の有効性が明らかにされていることから,本研究では,英語で提案されている手法の日本語化と日本語の文書検索における発音照合の有効性評価に取り組んだ.具体的には,まず,昨年度までの研究で開発してきた日本語の発音照合の符号化表の拡張と改良を行い,発音照合の手法をデータベース管理システムの動的ロード可能オブジェクトとして実装し,動作の検証を行った.さらに,昨年度までの研究で文書検索の評価に使用した情報検索システムのテストコレクションを使用して,文字列編集距離と日本語の発音照合を組み合わせた手法の有効性評価を行い,得られた知見をSIGIR2012 Workshop (OSIR2012)で報告した.
また,本年度は,海外の共同研究者とともに予備的検討を進めてきた文字n-gramを用いた言語に依存しない文書索引付の手法の検索効率性と検索有効性を検証するための評価実験を行い,得られた結果に基づく検討を行った.具体的には,過去の情報検索システムの評価型ワークショップNTCIR7/8 IR4QAで構築されたテストコレクションを用いて,言語に依存しない文書索引付の手法の評価方法を検討し,次に,種々の文書類似度の尺度を用いて,文字n-gramを用いた検索手法と,転置索引を用いた従来法との比較を行った.

現在までの達成度 (区分)
理由

24年度が最終年度であるため、記入しない。

今後の研究の推進方策

24年度が最終年度であるため、記入しない。

  • 研究成果

    (2件)

すべて 2012

すべて 学会発表 (2件)

  • [学会発表] 料理レシピに含まれる類似文字列の検索2012

    • 著者名/発表者名
      安川美智子
    • 学会等名
      情報処理学会自然言語処理研究会(NL),
    • 発表場所
      東北大学(宮城県)
    • 年月日
      20120902-20120903
  • [学会発表] Phonetic Matching in Japanese2012

    • 著者名/発表者名
      Michiko Yasukawa, J. Shane Culpepper, Falk Scholer
    • 学会等名
      Proc. SIGIR 2012 Workshop on Open Source Information Retrieval (OSIR2012)
    • 発表場所
      Portland, Oregon, USA
    • 年月日
      20120816-20120816

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi