2021 Fiscal Year Research-status Report
多言語口コミ情報の分析による顧客ニーズ抽出・学習アルゴリズムの開発と応用
Project/Area Number |
19K12231
|
Research Institution | University of Tsukuba |
Principal Investigator |
津田 和彦 筑波大学, ビジネスサイエンス系, 教授 (50302378)
|
Co-Investigator(Kenkyū-buntansha) |
吉田 健一 筑波大学, ビジネスサイエンス系, 教授 (40344858)
倉橋 節也 筑波大学, ビジネスサイエンス系, 教授 (40431663)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 自然言語処理 / 感性情報 |
Outline of Annual Research Achievements |
本研究は,インターネット上の口コミ情報の収集や質問紙調査で得た顧客の声から,多国における顧客の真のニーズを抽出すること,顧客の真のニーズの推移を把握すること,および,国毎の顧客ニーズの関係性を明らかにする顧客ニーズ抽出・学習アルゴリズムを実現することを目的に実施している. 昨年度は,口コミ情報収集モジュールにおいて日本語のTwitterから,タイ語においてはTwitterおよびFaceBookからデータ収集するモジュールを作成し,データの収集を継続している.その中でデータ収集上の不具合を検証すると共に,不具合に対する修正をしつつスパイラルアップ方式で口コミ情報収集モジュールの精度向上を実施した. この作業を実施している過程で,特にタイ人においては,公開される情報においては人の悪口を記載しないという国民性があることを掴んだ.この国民性により文面の表層は褒めたりしているポジティブな文書であっても,その裏を読むような思考ロジックがあることが示唆された. このことを確認するため,同じ文面に対して5名のタイ人にポジティブとネガティブの判定を実施した.データ数490文に対して,5:0もしくは4:1でポジティブかネガティブと判定したものは,約50%の文面で,残り約50%の文面は,3:2というポジティブかネガティブかが不明なデータとなった.今後はこの点を深堀しなければならないことが判明した. 口コミ情報分析モジュールで利用するマーケ指標辞書は,日本語でひな型を構築し,各国の言葉に翻訳することで実現する方針で進めることとした.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究は,インターネット上の口コミ情報の収集や質問紙調査で得た顧客の声から,多国における顧客の真のニーズを抽出すること,顧客の真のニーズの推移を把握すること,および,国毎の顧客ニーズの関係性を明らかにする顧客ニーズ抽出・学習アルゴリズムを実現ことを目的に実施している. すでに日本語においてはTwitterを中心に,十分な量と質の口コミ情報収集に成功した.またタイ語においては,TwitterよりFaceBookの方が口コミ情報が多いこと,タイ人の国民性として,公開情報には悪い感性を有する投稿は稀であることが発見できた.これは,研究の方向性は変更せざる得ない部分はあるが,本研究の目的とも合致しており十分な成果と言える. けれども,本研究の目的である“多言語における”という点では,COVID-19の影響で海外における実地調査などができないため,全くと言っていいほど進んでいないのが現状である.それゆえ,十分なデータ収集ができている日本語において,東日本と西日本の文面の意図理解,感性理解の差異を調査し,その差異を抽出するためのアルゴリズムの構築に取り組んでいる.このアルゴリズムが構築できれば,将来多国語のデータ収集が進んだ際に,各国の地域差異を考慮することに貢献するであろう.
|
Strategy for Future Research Activity |
上記の通り,タイ人は国民性として,公開情報には悪い感性を有する投稿は稀であることが発見できた.さらには,490文面のタイ語に対して,タイ人5名に感性情報付与をする実験を実施した.その結果から,約50%のデータにおいてポジティブとネガティブが3:2の割合になるという,あいまい性があることが明らかになった.今後は,このタイ人の感性の揺れる理由について深堀を実施する予定である.具体的には,タイ人へのヒアリングを介して,その理由を明らかにする予定である. また,コロナウイルスの影響で,収集対象として国とのコミュニケーションが取り辛い状況になることが懸案である.そのため,対象となる国数を削減することや,国の入れ替えが必要になる可能性は否めない.それゆえ,十分な情報収集ができている日本語データにおいて,東日本と西日本で感性の捉え方が異なることが分かっている.この差異を明らかにするアルゴリズムの構築を目指す予定である.このアルゴリズムが構築できれば,各国の地域差異を考慮することに貢献するであろう.
|
Causes of Carryover |
本研究は,多言語における口コミ情報の分析を研究目的としている.しかし,COVID-19感染拡大の影響により,各国で予定していたヒアリング調査を実施できないという事態に陥った.そのため,研究自体が遅れる状況に至った.
|
Research Products
(10 results)