2016 Fiscal Year Annual Research Report
A Study on Systematization of Culinary Vocabulary by Approximate String Matching and Related Terms Clustering
Project/Area Number |
26330363
|
Research Institution | Gunma University |
Principal Investigator |
安川 美智子 群馬大学, 大学院理工学府, 助教 (70361384)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 情報検索 / 情報組織化 / 自然言語処理 / 図書館情報学 / 分類型検索 / 言語横断検索 / アクセシビリティ / ユーザビリティ |
Outline of Annual Research Achievements |
2016年度の研究では、英語の大規模レシピコーパスを用いて、料理レシピの文書構造に注目した関連語推薦と対話的な検索質問拡張への応用についての検討を行い、得られた知見を2016年11月10日に慶応義塾大学日吉キャンパス(神奈川県横浜市)で開催された「人工知能学会 第14 回 インタラクティブ情報アクセスと可視化マイニング研究会」において口頭発表を行い、「2016年度 研究会優秀賞」を受賞した。提案手法では、検索ユーザにとって直感的な関連語推薦を行うために、「分類の粒度」と「分類の規則性」の2つの点を考慮した関連語推薦を行う。NTICR-11の料理レシピ検索タスクのテストコレクション(英語の大規模レシピコーパス、アドホック検索クエリ、適合判定ファイル)を用いた評価実験を行い、提案法による検索有効性の向上を確認した。また、提案手法を対話的な検索質問拡張に応用し、Googleの関連語推薦と比較した。Googleの関連語推薦では、例えば「ピザを作るときに使うチーズは?」という検索を行うための検索クエリとして「recipe pizza cheese」と入力した場合に、チーズの名称1件(具体例:goat cheese)が推薦されたが、他は「pizza」との強い関連性を持つ、「crust」や「tomato」などの関連語であった。提案法では、大規模レシピの検索範囲を「pizza AND cheese」で絞り込み、材料における接尾辞タイプの単語2-gram(単語2つの複合語の後半部分に指定の単語を含むもの)を検索することで、「mozzarella cheese」「parmesan cheese」「cheddar cheese」など、ピザ用の材料として使用されている多種多様なチーズをコーパス中の出現頻度が高い順番で推薦することができ、提案法の実応用における有用性を確認できた。
|
Research Products
(1 results)