2014 Fiscal Year Research-status Report
インターネット通販の「お客様の声」から探る青果物の消費者ニーズ
Project/Area Number |
26450370
|
Research Institution | National Agriculture and Food Research Organization |
Principal Investigator |
竹崎 あかね 独立行政法人農業・食品産業技術総合研究機構, 中央農業総合研究センター情報利用研究領域, 主任研究員 (40550520)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | テキストマイニング / 野菜商品レビュー / 形態素解析 / 重要語 |
Outline of Annual Research Achievements |
テキストマイニングでは、統計的手法による知見抽出に先立ちテキストから記述内容(概念)を抽出する言語処理が行われる。言語処理は公開ツールにより簡単に試行できるものの、テキストのドメインによっては新聞記事等整形テキストと同様の高い性能を得るのは難しい。本研究では農業分野における言語処理済みのテキスト(形態素解析・構文解析)から名詞・動詞・形容詞と品詞判定された語を抽出してテキスト内容の把握を試み、その精度向上方法を検討した。テストデータには今後農業分野においてテキストマイニングの必要性が高まるであろうネット通販レビューを用い、特に野菜レビューに着目して検討を行った。 品目出現率(ある語の出現レビューのうち、ある品目レビューに出現する割合)の高さを基準に重要語を選定したところ、重要語には、品種(例;サツマイモ:“あずま”)、商品特性(例;サツマイモ:“蜜”)、料理・食事(例;サツマイモ:“焼きいも”)、商品形態(例;ショウガ:“チューブ”)、健康機能性(例;ショウガ:“体温”、タマネギ:“血液”)に関する語があること、品目によりそのカテゴリが異なること(例;サツマイモは品種に関する語が多いがショウガは健康機能性に関する語が多い)、“あずま”(“紅あずま”)のように誤った分割や、“未来”(“味来”)のように別漢字での判定が認められることが明らかとなった。重要概念抽出のためには、これら重要語を判断材料に分析対象を限定すること、語分割に失敗した重要語を解析辞書に登録することが必要と判断した。400の重要語を辞書登録した結果、形態素解析による用語認識精度が向上した。また、1)否定概念が欠落しないように、助動詞“ぬ”、 接頭辞“無”・“不”・“低”・“未”・“非”、接尾辞“ない”について語の変換・集約処理をする。2)同義語を正規化することも解析精度向上に必要であることを示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画は1年間の楽天市場における「野菜・キノコ」ジャンル商品レビューを対象に1)参照辞書を構築し解析器の単語認識を可能とするとともに2)意図の認識、3)多義性の吸収、4)分析対象の選定手法を検討して言語処理精度を向上させることを目的とした。26年度は3年分の商品レビューにおいて上記1)2)3)を、1年分の商品レビューにおいて4)を実施し、来年度以降にさらなる精度向上が必要であるものの、当初の計画を達成した。
|
Strategy for Future Research Activity |
26年度に引き続き楽天市場における商品レビューをテストデータとして文書から重要概念を高精度に抽出する方法を検討する。また、ケーススタディとしてレビューが多い品目を対象に統計的手法による知見抽出を試みる。ニンジンについてはレビュー解析によって得られた知見とアンケート調査によって得られた知見を比較検討する。
|
Causes of Carryover |
次年度使用額275,921円は研究費を効率的に使用して発生した残額である。
|
Expenditure Plan for Carryover Budget |
次年度使用額は、次年度に請求する研究費とあわせて、効率的解析を可能にする、高速データ視覚化ツールを購入予定としており、研究計画遂行のために使用する。
|
Research Products
(3 results)