• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

言語に依存しない大規模テキストデータからの自動単語分割技術の確立

Research Project

Project/Area Number 16K01267
Research InstitutionShonan Institute of Technology

Principal Investigator

鈴木 誠  湘南工科大学, 工学部, 教授 (80339796)

Co-Investigator(Kenkyū-buntansha) 三川 健太  湘南工科大学, 工学部, 講師 (40707733)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywordsテキストマイニング / 多言語処理 / N-gram / 単語抽出 / 単語切り出し / 自動抽出 / 自動分割
Outline of Annual Research Achievements

本研究の目的は、Unicodeで表現された複数の言語が混在するテキストデータを、同一のプログラムで処理する単語分割技術を構築することである。この技術は、単純な状態遷移モデルに基づいた、各言語の辞書や文法知識を一切必要としない言語独立な単語分割方式であり、かつ口語体文書や古語も含めた世界中のあらゆる非分かち書き言語が混在している大規模なテキストデータも処理可能である可能性が高い。
本研究では、1)処理対象となる言語の拡張、2)適用事例の拡張、3)基礎理論の構築、の3方向に研究を進めている。
平成30年度は2)と3)の方向性で研究を進めた。成果としては、2)の方向性で2件の論文が論文誌に採録になり,国際会議で1件の論文を,国内の学会で3件の論文を口頭発表した。また、3)の方向性で,国際会議で2件の論文を,国内の学科でも2件の論文を発表した。
例えば、研究発表リスト中の最初の論文「気象情報とTweetデータの統合的分析による体感気温の定量化とその需要予測への応用」では、小売店における在庫過多や廃棄処分を課題とした。この市場における需要予測を考えた場合、気温や天候などの気象条件はその重要な要因であるといえる。その一方で、商品需要は気温などの単純な気象情報ではなく、消費者が感じる体感気温の影響を受けることが想定される。体感気温の定量化に関する研究は数多くなされてきており、湿度や風速といった気象条件に影響を受けやすいといったことがわかっている。加えて、体感気温はこれらの気象条件以外にも、着衣量、代謝量といった人体条件の影響も受けるといわれており、その感覚の定量化の方法は様々である。そこで、大規模データであるTwitterのデータを学習し、需要予測のための体感気温の定量化を行うモデルを提案するとともに、需要予測への利用の有効性について検討を行った。

Current Status of Research Progress
Current Status of Research Progress

4: Progress in research has been delayed.

Reason

家族の病気により、2018年度末に「科学研究費助成事業(学術研究助成基金助成金)補助事業期間延長承認申請書」を提出し、延長を認めていただいた。

Strategy for Future Research Activity

今後は、提案手法を文書分類やWebマイニングやマーケティングなどの実問題へ適応した成果を国際学会等で発表する予定である。

Causes of Carryover

予定していた国際学会での発表ができなかったため。
既に科学研究費助成事業助成金の補助事業期間の延長を承認していただいており、残額は主に国際学会での発表に使用する予定である。

  • Research Products

    (10 results)

All 2018

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (8 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] 気象情報とTweetデータの統合的分析による体感気温の定量化とその需要予測への応用2018

    • Author(s)
      馬賀嵩士, 三川健太,後藤正幸,吉開朋弘
    • Journal Title

      電子情報通信学会論文誌D

      Volume: Vol. J101-D, No. 7 Pages: 1037-1051

    • Peer Reviewed
  • [Journal Article] 推定購買確率と予測評価値をバランスする意外性指標に基づく推薦システム2018

    • Author(s)
      関口あゆみ, 仁ノ平 将人,三川健太,後藤正幸
    • Journal Title

      経営情報学会誌

      Volume: Vol.27, No.1 Pages: 67-78

    • Peer Reviewed
  • [Presentation] A Study of the Application of Canonical Correlation Forests to Text Classification2018

    • Author(s)
      Shuhei Nakano, Kenta Mikawa, and Masayuki Goto
    • Organizer
      The 19th Asia Pacific Industrial Engineering and Management Systems (APIEMS2018)
    • Int'l Joint Research
  • [Presentation] Proposal for an l1 regularized Factorization Machine2018

    • Author(s)
      Kenta Mikawa, Manabu Kobayashi, Masayuki Goto, and Shigeichi Hirasawa
    • Organizer
      The 19th Asia Pacific Industrial Engineering and Management Systems (APIEMS2018)
    • Int'l Joint Research
  • [Presentation] A New Entry Behavior Model of Student Users on Job Board for New Graduates Considering the Interaction between Features2018

    • Author(s)
      Tomoya Sugisaki, Yuri Nishio, Kenta Mikawa, Masayuki Goto, and Takashi Sakurai
    • Organizer
      16th Asian Network for Quality Congress
    • Int'l Joint Research
  • [Presentation] 周期性とイベント効果に着目した消費者の購買行動分析モデルに関する一考察2018

    • Author(s)
      安井一貴,中野修平,三川健太,後藤正幸
    • Organizer
      日本経営工学会平成30年度春季研究大会予稿集
  • [Presentation] 特徴間の交互作用を考慮した学生ユーザの企業エントリー行動分析モデルに関する一考察2018

    • Author(s)
      杉崎智哉,西尾友里,三川健太,後藤正幸,桜井 崇
    • Organizer
      日本経営工学会平成30年度春季研究大会予稿集
  • [Presentation] l1正則化に基づくFactorization Machineに関する一考察2018

    • Author(s)
      三川健太,小林 学,後藤正幸,平澤茂一
    • Organizer
      日本経営工学会平成30年度春季研究大会予稿集
  • [Presentation] MineCraftを用いたDQNによる構造物の自動構築の検討2018

    • Author(s)
      畠山一輝,三川健太,小林学
    • Organizer
      2018年電子情報通信学会ソサイエティ大会予稿集
  • [Presentation] Canonical Correlation Forests におけるラベル行列のスパース性を考慮した 分類法に関する一考察2018

    • Author(s)
      中野修平,三川健太,後藤正幸
    • Organizer
      情報処理学会第121回数理モデル化と問題解決研究発表会

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi