• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

言語に依存しない大規模テキストデータからの自動単語分割技術の確立

研究課題

研究課題/領域番号 16K01267
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 社会システム工学・安全システム
研究機関湘南工科大学

研究代表者

鈴木 誠  湘南工科大学, 工学部, 教授 (80339796)

研究分担者 三川 健太  湘南工科大学, 工学部, 准教授 (40707733)
研究期間 (年度) 2016-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2017年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2016年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
キーワード多言語処理 / 感情極性辞書 / テキストマイニング / N-gram / 単語抽出 / 単語切り出し / 自動抽出 / 自動分割
研究成果の概要

本研究では、Unicodeで表現された複数の言語が混在するテキストデータを、同一のプログラムで処理する単語分割技術を構築した。この技術は、単純な状態遷移モデルに基づいた、各言語の辞書や文法知識を一切必要としない言語独立な単語分割方式である。主に、(1)処理対象となる言語の拡張、(2)適用事例の拡張、の2つの方向性を意識して研究を進めた。(1)については、日本語以外にも日本語の古典や英語、中国語、韓国語などの外国語に対しても有効であることが確認できた。(2)については、商品や施設のユーザレビューを用いて感情極性辞書を自動的に作成する手法を提案することができた。

研究成果の学術的意義や社会的意義

本研究では、対象のレビューデータをもとに感情極性辞書を自動的に作成する手法を提案することができた。感情極性辞書とは、文章に含まれる単語に対し、文中に含まれる特有の極性(ポジティブ、ネガティブ)を持つ単語が含まれているという考えに基づき、単語に対し極性値を与えた辞書である。今回は商品や施設のユーザレビュー(5段階の評価値付きのテキストデータ)を用いて、評価値に基づいて感情極性値を算出することにより、感情極性辞書を自動的に作成する手法を提案した。これにより、コンピュータが自動的にユーザレビューを収集し、ある商品や施設に特化した感情極性辞書を構成できる可能性を示唆することができた。

報告書

(5件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 2016 実施状況報告書
  • 研究成果

    (38件)

すべて 2020 2019 2018 2017 2016

すべて 雑誌論文 (15件) (うち国際共著 1件、 査読あり 15件、 オープンアクセス 10件、 謝辞記載あり 1件) 学会発表 (23件) (うち国際学会 11件)

  • [雑誌論文] 周期性とイベント効果に着目した消費者の購買行動分析モデルに関する一考察2019

    • 著者名/発表者名
      安井一貴,中野修平,三川健太,後藤正幸
    • 雑誌名

      経営情報学会誌

      巻: Vol.28, No.2 ページ: 69-87

    • NAID

      40022046971

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] An Analytic Model to Represent Relation between Finish Date of Job-Hunting and Time-Series Variation of Entry Tendencies2019

    • 著者名/発表者名
      S. Nagamori, K. Mikawa, M. Goto, and T. Ogihara
    • 雑誌名

      Industrial Engineering & Management Systems

      巻: Vol.18, No.3 ページ: 292-304

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] 販売履歴データに基づく中古ファッションアイテムの販売価格予測モデルに関する一考察2019

    • 著者名/発表者名
      仁ノ平 将人,三川健太,後藤正幸
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.60, No.4 ページ: 1151-1161

    • NAID

      170000150291

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] 気象情報とTweetデータの統合的分析による体感気温の定量化とその需要予測への応用2018

    • 著者名/発表者名
      馬賀嵩士, 三川健太,後藤正幸,吉開朋弘
    • 雑誌名

      電子情報通信学会論文誌D

      巻: Vol. J101-D, No. 7 ページ: 1037-1051

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] 推定購買確率と予測評価値をバランスする意外性指標に基づく推薦システム2018

    • 著者名/発表者名
      関口あゆみ, 仁ノ平 将人,三川健太,後藤正幸
    • 雑誌名

      経営情報学会誌

      巻: Vol.27, No.1 ページ: 67-78

    • NAID

      40021645389

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] マルコフ潜在クラスモデルに基づくECサイトにおける施策実施効果分析に関する一考察2017

    • 著者名/発表者名
      松嵜祐樹, 三川健太,後藤正幸
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.58, No.12 ページ: 2034-2045

    • NAID

      170000149126

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Adaptive Prediction Method Based on Alternating Decision Forests with Considerations for Generalization Ability2017

    • 著者名/発表者名
      S. Misawa, K. Mikawa, and M. Goto
    • 雑誌名

      Industrial Engineering & Management Systems

      巻: Vol.16, No.3 ページ: 384-391

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Multi-Valused Classification of Text Data Based on an ECOC Approach Using a Ternary Orthogonal Table2017

    • 著者名/発表者名
      L. Suzuki, K. Mikawa, and M. Goto
    • 雑誌名

      Industrial Engineering & Management Systems

      巻: Vol.16, No.2 ページ: 155-164

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A Proposal for Classification of Document Data with Unobserved Categories Considering Latent Topics2017

    • 著者名/発表者名
      Y. Yamamoto, K. Mikawa, and M. Goto
    • 雑誌名

      Industrial Engineering & Management Systems

      巻: Vol.16, No.2 ページ: 165-174

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] データの転送制御に基づいた分散型SVMの効率的な学習手法2017

    • 著者名/発表者名
      湯川 輝一朗, 三川健太,後藤正幸
    • 雑誌名

      日本経営工学会論文誌

      巻: Vol.68, No.2 ページ: 86-98

    • NAID

      130005991018

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 閲覧及び購買行動を同時に表現するアスペクトモデルによる購買予測手法の提案2017

    • 著者名/発表者名
      藤原直広, 三川健太,後藤正幸
    • 雑誌名

      経営情報学会誌

      巻: Vol.26, No.1 ページ: 1-16

    • NAID

      40021242891

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 層別木と混合ワイブル分布に基づく就職活動終了時期の分析モデルの構築2017

    • 著者名/発表者名
      早川真央, 三川健太,荻原大陸,後藤正幸
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.58, No.5 ページ: 1189-1206

    • NAID

      170000148583

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Data pair selection for accurate classification based on information-theoretic metric learning2017

    • 著者名/発表者名
      T. Maga, K. Mikawa, and M. Goto
    • 雑誌名

      Asian J. Management Science and Applications

      巻: Vol.3, No.1 ページ: 61-74

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Language-Independent Word Acquisition Method Using a State-Transition Model", Industrial Engineering & Management Systems2016

    • 著者名/発表者名
      Bin Xu, Naohide Yamagishi, Makoto Suzuki, Masayuki Goto
    • 雑誌名

      Industrial Engineering & Management Systems

      巻: Vol.15, No.3 号: 3 ページ: 197-207

    • DOI

      10.7232/iems.2016.15.3.224

    • 関連する報告書
      2016 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] カテゴリ毎に異なる計量行列を用いた計量距離学習手法に関する一考察2016

    • 著者名/発表者名
      三川健太,後藤正幸
    • 雑誌名

      日本経営工学会論文誌

      巻: Vol.66, No.4 ページ: 335-347

    • NAID

      130005127091

    • 関連する報告書
      2016 実施状況報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] Analysis of Review Data on Educational Toys2020

    • 著者名/発表者名
      M.Suzuki, T.Onuma, N.Katsumata and N.Yamagishi
    • 学会等名
      International Conference on Education
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] ゴルフ場のレビューデータを用いた感情極性辞書の作成2019

    • 著者名/発表者名
      勝間田 昇, 山岸 直秀, 鈴木 誠
    • 学会等名
      経営情報学会春季全国研究発表大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 知育玩具に関するレビューデータの分析2019

    • 著者名/発表者名
      小沼 拓也, 山岸 直秀, 鈴木 誠
    • 学会等名
      経営情報学会春季全国研究発表大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Factorization Machine with Mixed Norm Regularization using ADMM2019

    • 著者名/発表者名
      K. Mikawa
    • 学会等名
      20th Asia Pacific Industrial Engineering and Management System (APIEMS2019)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] An Estimation Model of Open Price for Second-hand Fashion Items Based on Sales History Data2019

    • 著者名/発表者名
      Kuwata, T. Sugisaki, K. Mikawa, and M. Goto
    • 学会等名
      Proc. 17th Asian Network for Quality Congress (ANQ2019)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] An Extension of Semi-Supervised Boosting to Multiclass Classification2019

    • 著者名/発表者名
      Y. Sakai, K. Yasui, K. Mikawa, and M. Goto
    • 学会等名
      Proc. 17th Asian Network for Quality Congress (ANQ2019)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] An Analytical Model of Consumers Purchasing Behavior Considering the Variety of Products2019

    • 著者名/発表者名
      K. Yasui, K. Mikawa, and M. Goto
    • 学会等名
      Proc. 17th Asian Network for Quality Congress (ANQ2019)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Factorization Machines Considering the Latent Characteristics Behind Target Data2019

    • 著者名/発表者名
      T. Sugisaki, K. Mikawa, and M. Goto
    • 学会等名
      Proc. 17th Asian Network for Quality Congress (ANQ2019)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] A Study of the Application of Canonical Correlation Forests to Text Classification2018

    • 著者名/発表者名
      Shuhei Nakano, Kenta Mikawa, and Masayuki Goto
    • 学会等名
      The 19th Asia Pacific Industrial Engineering and Management Systems (APIEMS2018)
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Proposal for an l1 regularized Factorization Machine2018

    • 著者名/発表者名
      Kenta Mikawa, Manabu Kobayashi, Masayuki Goto, and Shigeichi Hirasawa
    • 学会等名
      The 19th Asia Pacific Industrial Engineering and Management Systems (APIEMS2018)
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] A New Entry Behavior Model of Student Users on Job Board for New Graduates Considering the Interaction between Features2018

    • 著者名/発表者名
      Tomoya Sugisaki, Yuri Nishio, Kenta Mikawa, Masayuki Goto, and Takashi Sakurai
    • 学会等名
      16th Asian Network for Quality Congress
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] 周期性とイベント効果に着目した消費者の購買行動分析モデルに関する一考察2018

    • 著者名/発表者名
      安井一貴,中野修平,三川健太,後藤正幸
    • 学会等名
      日本経営工学会平成30年度春季研究大会予稿集
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 特徴間の交互作用を考慮した学生ユーザの企業エントリー行動分析モデルに関する一考察2018

    • 著者名/発表者名
      杉崎智哉,西尾友里,三川健太,後藤正幸,桜井 崇
    • 学会等名
      日本経営工学会平成30年度春季研究大会予稿集
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] l1正則化に基づくFactorization Machineに関する一考察2018

    • 著者名/発表者名
      三川健太,小林 学,後藤正幸,平澤茂一
    • 学会等名
      日本経営工学会平成30年度春季研究大会予稿集
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] MineCraftを用いたDQNによる構造物の自動構築の検討2018

    • 著者名/発表者名
      畠山一輝,三川健太,小林学
    • 学会等名
      2018年電子情報通信学会ソサイエティ大会予稿集
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Canonical Correlation Forests におけるラベル行列のスパース性を考慮した 分類法に関する一考察2018

    • 著者名/発表者名
      中野修平,三川健太,後藤正幸
    • 学会等名
      情報処理学会第121回数理モデル化と問題解決研究発表会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Characteristics of a Word Segmentation Method Based on a State-transition Model2017

    • 著者名/発表者名
      M.Suzuki, N.Yamagishi, K.Mikawa and M.Goto
    • 学会等名
      Proc. of Asia Pacific Industrial Engineering and Management Systems Conference (APIEMS2017)
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] Distance Metric Learnig using Each Category Centroid with Nuclear Norm Regularization2017

    • 著者名/発表者名
      K. Mikawa, M. Kobayashi, M. Goto, and S. Hirasawa
    • 学会等名
      The 2017 IEEE Symposium Series on Computational Intelligence (IEEE SSCI 2017)
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] Word Acquisition of Japanese Classical Literature Using State Transition Model2016

    • 著者名/発表者名
      Makoto Suzuki, Bin Xu, Naohide Yamagishi, Masayuki Goto
    • 学会等名
      Asia Pacific Industrial Engineering and Management Systems Conference (APIEMS2016)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2016-12-07
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会
  • [学会発表] A Study on Distance Metric Learning using Distance Structure among Category Centroids2016

    • 著者名/発表者名
      Kenta Mikawa, Manabu Kobayashi, Masayuki Goto, Shigeichi Hirasawa
    • 学会等名
      Asia Pacific Industrial Engineering and Management Systems Conference (APIEMS2016)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2016-12-07
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会
  • [学会発表] A proposal of document recommendation based on topic model2016

    • 著者名/発表者名
      Yusei Yamamoto, Kenta Mikawa, Masayuki Goto
    • 学会等名
      Asia Pacific Industrial Engineering and Management Systems Conference (APIEMS2016)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2016-12-07
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会
  • [学会発表] Modeling customer purchase behavior based on page transitions by latent class model for customer segmentation2016

    • 著者名/発表者名
      Yuki Matsuzaki, Kenta Mikawa, Masayuki Goto
    • 学会等名
      Asia Pacific Industrial Engineering and Management Systems Conference (APIEMS2016)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2016-12-07
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会
  • [学会発表] A study of extended RFM analysis based on PLSA model for Purchase History Data2016

    • 著者名/発表者名
      Qian Zhang, Haruka Yamashita, Kenta Mikawa, Masayuki Goto
    • 学会等名
      Asia Pacific Industrial Engineering and Management Systems Conference (APIEMS2016)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2016-12-07
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会

URL: 

公開日: 2016-04-21   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi