2017 Fiscal Year Annual Research Report
Mining the customer preferences from online agricultural product reviews
Project/Area Number |
26450370
|
Research Institution | National Agriculture and Food Research Organization |
Principal Investigator |
竹崎 あかね 国立研究開発法人農業・食品産業技術総合研究機構, 農業技術革新工学研究センター, 上級研究員 (40550520)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 野菜商品レビュー / テキスト解析 / 品質保証要素 / レシピデータ / 消費者 |
Outline of Annual Research Achievements |
インターネット通販の野菜商品レビューを対象に、レビュー内容を把握するための概念抽出工程を以下の通り提案した。1)解析対象に合致した参照辞書を構築して形態素解析を行う。2)構文解析後、動詞“する”は、その直前に出現する名詞と一語に集約し、具体的動作を示す動詞に変換する。3)否定概念を付与するために、助動詞“ぬ”、 接頭辞“無”・“不”・“低”・“未”・“非”、接尾辞“ない”について語の変換、集約処理をする。4)同義語を正規化する。5)解析対象に合わせて係り受け関係の語を抽出する。野菜商品レビューを対象とした形態素解析用辞書については、品種・ブランド名を含む商品名登録が重要であること、健康機能性・安全性等の用語を登録すべきであるが体系的に整理された研究者語彙から収集可能であること、同表記異義語を区別した品種・ブランド名の登録が必要であることを明らかにするとともに、形態素解析用辞書、同義語辞書を構築した。 商品レビューで品目特異的に高出現する用語は、消費者が重視する品質保証要素(品種、栽培技術、産地等)に関連があると仮定し、上記概念抽出工程を用いて商品レビューを解析した。品種等ブランド名(品種名・品種総称・地域等で設定されたブランド名)は、サツマイモ・トウモロコシ・ジャガイモ・トマトで高出現したものの、タマネギ、ニンジン等では認められず、消費者が重視する品質保証要素には品目間差があると推測した。また、生産者と卸売業者間で利用されるベジフルコードの登録商品名を、野菜商品レビューの解析結果と比較し、インターネット通販における商品の特徴を考察した。 提案した概念抽出工程を他のデータセット;消費者の投稿レシピデータに適用した。ヨーグルトについてのアンケート結果と、レシピデータの解析結果を組み合わせて分析することで、食材としての新たな利用方法の抽出が可能と判断した。
|