2014 Fiscal Year Research-status Report
類似文字列検索と分類型検索を活用した調理用語の体系化に関する研究
Project/Area Number |
26330363
|
Research Institution | Gunma University |
Principal Investigator |
安川 美智子 群馬大学, 大学院理工学府, 助教 (70361384)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ディレクトリ・情報検索 / 情報図書館学 / 情報システム / 多言語処理 / 栄養学 |
Outline of Annual Research Achievements |
本研究は、国民の毎日の食生活に深く関わる調理用語を体系化し、電子化辞書を構築することを主たる目的としている。電子化辞書は、記録媒体としてDVDメディアやHDDなどの電子的手段を用い、機械可読な形式で構造化された辞書データである。調理用語を体系化し、電子化辞書として整備することで、食に関する情報を含む文書検索システムや栄養計算ソフトウェアのユーザビリティの向上に役立てることができる。
初年度の研究では、文部科学省科学技術・学術審議会資源調査分科会報告 「日本食品標準成分表2010」 に収載されている食品名(Food and description)を抽出し、機械可読な形式で、単語のリストを作成した。また、大規模なユーザ生成コンテント(User Generated Content)に含まれる食品名の表記揺れを、類似文字列検索の手法を用いて効率的かつ効果的に抽出し、同じ食品名を表す表記が異なる単語のリストを半自動的に作成する手法について検討した。さらに、NTCIR-11ワークショップに参加し、調理や食材についての情報を扱う情報アクセスのための技術について、議論と意見交換を行った。具体的には、ソーシャル・ネットワーキング・サービス(social networking service)に投稿された日本語の料理レシピと、情報推薦(recommendation)と個別化(personalization)を行うウェブアプリケーション(Web application)でクローリングされた英語のレシピを検索対象とする料理レシピ検索のアドホック(ad hoc)検索タスクと、献立作成を簡易化したレシピ・ペアリング(recipe pairing)のタスクを設計し、検索結果データの作成、人手での適合判定、公式評価結果の出力と結果に基づく検討を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は、調理方法や調理する食材に関する単語を分類し、体系化した電子化辞書の構築を主たる目的としており、現在までの研究で、日常的な食品に対応する食材名の単語リストを作成した。また、作成した単語リストを用いた新たな情報検索タスクの提案を行うとともに、研究者コミュニティの共通の評価基盤となるテストコレクションの構築に取り組んだ。本年度、評価型ワークショップNTCIR-11に参加し、国内・海外の研究者と意見交換を行えたことは本研究の全体構想の中でも特に重要な意義があり、初年度にこれを達成できていることから、本研究は当初計画に基づき、順調に進展していると言える。
|
Strategy for Future Research Activity |
NTCIR-11への参加により得られた知見を今後の研究において積極的に活用し、調理用語の体系化を目的とした電子化辞書の構築を次年度以降、研究計画通りに進めていく予定である。現在のところ、研究遂行上の問題点は特に生じていない。また今後の研究において、電子化辞書を活用した新たな情報アクセス技術について検討するため、国内・海外の研究者との情報交換を継続的に進めていくとともに、既存の電子化辞書を活用した情報アクセス技術の評価方法についても検討していく予定である。
|
Research Products
(2 results)