2016 Fiscal Year Annual Research Report

知識創出ツールに基づくことにより実利用可能となるテキストマイニング手法の開発

Research Project

Project/Area Number	15H03383
Research Institution	Saitama Gakuen University
Principal Investigator	菰田文男埼玉学園大学, 経済経営学部, 教授 (60116720)
Co-Investigator(Kenkyū-buntansha)	井口知栄慶應義塾大学, 商学部(三田), 准教授 (20411209) 林倬史国士舘大学, 経営学部, その他 (50156444) 中山厚穂首都大学東京, 社会科学研究科, 准教授 (60434198) 荒井将志亜細亜大学, 国際関係学部, 講師 (70549691)
Project Period (FY)	2015-04-01 – 2018-03-31
Keywords	テキストマイニング / データマイニング / 知の構造化 / ＢＯＰビジネス / 国際化 / 日本企業
Outline of Annual Research Achievements	本年度は前年度におこなった解析(『日本経済新聞』、ＪＥＴＲＯの報告書のＢＯＰビジネス関連テキストデータを用いた解析)の精度を高めるため、「鳥瞰図描画型テキストマイニング」と「ピンポイントフォーカス型テキストマイニング」という概念を導入し、精度向上のためには前者にとどまるのではなく、後者にまで進んだ解析が必要であることを論じた。後者は重要な意味を体現していながら、出現頻度が少ないために膨大なノイズの中に埋没してしまい、解析から脱落しがちな「重要語」を含んでいる箇所に可能な限り的確にピンポイントで辿り着き、さらにまたこの「重要語」を文脈から切り離して抽出するするのではなく、構文を持つ基本句・基本文の中に位置づけて抽出するためのマイニング手法である。この「ピンポイントフォーカス型テキストマイニング」手法を開発し提起するために、日本経済新聞社の刊行する『日経ビジネス』誌、世界銀行の多数のスタッフが公開しているブログ、世界のＢＯＰビジネスにかんする業界誌などのテキストデータをとりあげ、それを5文単位のテキストブロックに加工してラベリングし、これをマイニング単位とした。5文を単位としてテキストブロックを作成した理由は、文脈の最小単位は5～10文程度であると仮定するからであり、さらにまたこの文脈を表現する基本句・基本文を作成するにはこの程度の長さが最適であると考えられるからである。この手法を適用するために、(1)特長語を起点として構文を構成する諸先行研究、(2)重み布置多次元尺度構成法にかんする研究をはじめとする多くの諸先行研究等に依拠した。以上の結果は複数の論文として執筆され、刊行を予定している。さらに以上の分析結果が現実のＢＯＰビジネスを的確に反映しているかどうかを知るために、昨年度に引き続いてフィリピン、ベトナム等のＢＯＰビジネスの実態について調査し研究報告をおこなった。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本研究の基本的な目的はテキストマイニング手法の開発であるが、この手法の開発のための素材として発展途上国の経済開発に貢献できると期待されるＢＯＰ(Base of the Pyramid)ビジネスにかんするテキストデータを用い、解析結果の妥当性の検証をおこなうので、日本企業および欧米企業のＢＯＰビジネスの実態の現地調査と分析をおこなう。したがって、その動向を知るという派生的な研究目的がある。昨年度はテキストマイニングについての研究は、テキストデータの収集、その解析のためのデータ加工などが中心になり、大きな進展はなかったのに対して、後者のＢＯＰビジネスの実態調査についてはフィリピン、ベトナムなどの調査などを通じて研究の進展があった。本年度はテキストマイニング研究については、複数のテキストデータを用いて、マイニングから得られる意味・知識の精度を高めるという本来の研究目的を達成するための試みにかんして、かなりの進展が得られた。すなわち、出現頻度が少ないにもかかわらず重要な意味を含んでいる語にピンポイントで辿り着くための手法としてのテキストブロックの作成とそのラベリング、テキストブブロック間の類似性の発見等による重要なテキストブロックの発見、この類似性を利用した基本句・基本文の作成と進化のための手法を提示するための準備作業をおこなうことができた。さらにこのテキストマイニング手法をＢＯＰビジネに適用し、東南アジア諸国のＢＯＰビジネスの動向についての現地調査結果とすりあわせをおこなうこともできた。
Strategy for Future Research Activity	1年目の研究において、テキストマイニング手法を工夫するために必要なテキストデータの収集、マイニング可能な形式への加工、予備的検索をおこない、2年目の研究において「鳥瞰図描画型テキストマイニング」から「ピンポイントフォーカス型テキストマイニング」にまで進むことによってマイニング精度を向上させるための手法を提起することができた。次の課題は「ピンポイントフォーカス型テキストマイニング」によってマイニング精度を高めるために、テキストデータをどのように加工するのが適切であるのか、その解析のためにどのようなツールと統計解析手法を適用することが望ましいのかなどについての研究をさらに深めることである。そのために、5文程度のテキストブロックの作成とラベリングの意義が大きいことは確認済みであるが、さらにテキストブロックをさまざまな大きさ(たとえば3文単位、10文単位、パラグラフ単位、節単位等々)で抽出し比較することによって、マイニング精度の向上に望ましいテキストブロックの大きさを発見する。さらに、テキストブロック間の類似性を発見するために、クラスター分析やその他の解析手法のいずれが適切であるのかの研究も重要な分析課題となる。またテキストデータから精度の高い意味・知識を発見するためには、形態素や語の単出現頻度や語と語の共起出現頻度のように「形態素」「語」の括りで論じているのでは不十分であり、構文を持つ句や文として論じられることが必要であるという基本的な認識に立って、基本句・基本文を作成し、それを適切な方向に進化させてゆくための手法を提起することを目指す。そのためにＢＯＰビジネスの実態調査についてもフィリピン、ベトナムを中心に継続し、「ピンポイントフォーカス型テキストマイニング」手法の解析結果の評価・検証に利用する。

Research Products

(19 results)

All 2017 2016

All Journal Article (4 results) (of which Int'l Joint Research: 1 results) Presentation (9 results) (of which Int'l Joint Research: 3 results, Invited: 2 results) Book (6 results)

[Journal Article] テキストデータの分析によるBOPビジネス動向の研究2016
- Author(s)
  林倬史,菰田文男,中山厚穂
- Journal Title
  
  国士舘大学経営研究所紀要
  
  Volume: 46 Pages: 1-50
[Journal Article] 新興国市場とBOP戦略論の新たな展開ー開発経営学を目指して2016
- Author(s)
  林倬史
- Journal Title
  
  経済論叢
  
  Volume: 6(1) Pages: 55-86
[Journal Article] 海外の国際ビジネス関連学会とジャーナルとの関わり方2016
- Author(s)
  井口知栄
- Journal Title
  
  国際ビジネス研究
  
  Volume: 8(2) Pages: 179-185
[Journal Article] International Human Resource Management of Japanese Multinational Corporations: Challenges and Future Directions2016
- Author(s)
  Sekiguchi, T., Froese, F. J. and Iguchi, C
- Journal Title
  
  Asian Business and Management
  
  Volume: 15(5) Pages: 1-27
- Int'l Joint Research
[Presentation] Analysis of Trending Topics in Consumer Web Communication Data2016
- Author(s)
  Nakayama, A.
- Organizer
  Abstracts of German-Japanese Symposium 2016
- Place of Presentation
  Schloss Reisensburg, Gunzburg
- Year and Date
  2016-12-12
- Int'l Joint Research / Invited
[Presentation] Base-of-Pyramid business strategies to tackle poverty in emerging countries: Strategic management in economic development2016
- Author(s)
  Hayashi, T., Iguchi, C., Arai, M.
- Organizer
  European International Business Academy
- Place of Presentation
  Wienna
- Year and Date
  2016-12-03
- Int'l Joint Research
[Presentation] The Effects of Inter-Organizational Collaborative R&D on MNEs' Innovation Systems2016
- Author(s)
  Iguchi, C. Hayashi, T. and Nakayama, A.
- Organizer
  European International Business Academy
- Place of Presentation
  Wienna
- Year and Date
  2016-12-03
- Int'l Joint Research / Invited
[Presentation] 新興国市場の特質と新たなBOP戦略論2016
- Author(s)
  林倬史
- Organizer
  日本経営学会関東部会
- Place of Presentation
  日本大学東京
- Year and Date
  2016-11-26
[Presentation] アジアにおけるBOP戦略と経営戦略論の再検討2016
- Author(s)
  林倬史
- Organizer
  アジア経営学会全国大会
- Place of Presentation
  九州産業大学福岡
- Year and Date
  2016-09-06
[Presentation] 日系企業の研究開発・技術開発のアジア域内でのリロケーション2016
- Author(s)
  .井口知栄
- Organizer
  アジア経営学会全国大会
- Place of Presentation
  九州産業大学福岡
- Year and Date
  2016-09-06
[Presentation] マーケティングにおけるWebコミュニケーションデータ活用の可能性2016
- Author(s)
  中山厚穂
- Organizer
  統計関連学会連合大会
- Place of Presentation
  金沢大学　金沢
- Year and Date
  2016-09-05
[Presentation] マーケティングデータにおける非対称性の分析-Web上のマーケティング・コミュニケーションデータの分析-2016
- Author(s)
  中山厚穂
- Organizer
  日本行動計量学会44回全国大会
- Place of Presentation
  札幌学院大学　江別
- Year and Date
  2016-08-31
[Presentation] クラスタ中心を再計算しない大規模データのための非階層的クラスタリング2016
- Author(s)
  中山厚穂，出口慎二,烏谷正彦
- Organizer
  日本行動計量学会44回全国大会
- Place of Presentation
  札幌学院大学　江別
- Year and Date
  2016-08-31
[Book] The Classification and Visualization of Twitter　Trending Topics Considering Time Series Variation. In F.2017
- Author(s)
  Nakayama, A.
- Total Pages
  in press
- Publisher
  Springer-Verlag
[Book] The Effects of Inter-Organizational Collaborative R&D on MNEs' Innovation Systems, in T. Sakamoto and S. Shoda (eds) Global, Innovative and Environmental Management2017
- Author(s)
  Iguchi, C. Hayashi, T. and Nakayama, A
- Total Pages
  17
- Publisher
  Maruzen Planet
[Book] 新興国市場の特質と新たなBOP戦略論2016
- Author(s)
  林倬史
- Total Pages
  207
- Publisher
  文眞堂
[Book] Evaluating the Necessity of a Triadic Distance Model. In A. F. X. Wilhelm, and H. A. Kestler (Eds.), Analysis of Large and Complex Data2016
- Author(s)
  Nakayama, A.
- Total Pages
  11
- Publisher
  Springer-Verlag
[Book] 調査に従事する人々のための統計学応用講座　第4版2016
- Author(s)
  中山厚穂
- Total Pages
  133
- Publisher
  マーケティング・リサーチ協会
[Book] グローバル化と多国籍企業」、関口・竹内・井口編『国際人的資源管理』2016
- Author(s)
  井口知栄
- Total Pages
  18
- Publisher
  中央経済社

2016 Fiscal Year Annual Research Report

知識創出ツールに基づくことにより実利用可能となるテキストマイニング手法の開発

Principal Investigator

菰田 文男 埼玉学園大学, 経済経営学部, 教授 (60116720)

Current Status of Research Progress

Reason

Research Products

[Journal Article] テキストデータの分析によるBOPビジネス動向の研究2016

Author(s)

Journal Title

[Journal Article] 新興国市場とBOP戦略論の新たな展開ー開発経営学を目指して2016

Author(s)

Journal Title

[Journal Article] 海外の国際ビジネス関連学会とジャーナルとの関わり方2016

Author(s)

Journal Title

[Journal Article] International Human Resource Management of Japanese Multinational Corporations: Challenges and Future Directions2016

Author(s)

Journal Title

[Presentation] Analysis of Trending Topics in Consumer Web Communication Data2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Base-of-Pyramid business strategies to tackle poverty in emerging countries: Strategic management in economic development2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] The Effects of Inter-Organizational Collaborative R&D on MNEs' Innovation Systems2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 新興国市場の特質と新たなBOP戦略論2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] アジアにおけるBOP戦略と経営戦略論の再検討2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 日系企業の研究開発・技術開発のアジア域内でのリロケーション2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] マーケティングにおけるWebコミュニケーションデータ活用の可能性2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] マーケティングデータにおける 非対称性の分析-Web上のマーケティング・コミュニケーションデータの分析-2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] クラスタ中心を再計算しない 大規模データのための 非階層的クラスタリング2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Book] The Classification and Visualization of Twitter Trending Topics Considering Time Series Variation. In F.2017

Author(s)

Total Pages

Publisher

[Book] The Effects of Inter-Organizational Collaborative R&D on MNEs' Innovation Systems, in T. Sakamoto and S. Shoda (eds) Global, Innovative and Environmental Management2017

Author(s)

Total Pages

Publisher

[Book] 新興国市場の特質と新たなBOP戦略論2016

Author(s)

Total Pages

Publisher

[Book] Evaluating the Necessity of a Triadic Distance Model. In A. F. X. Wilhelm, and H. A. Kestler (Eds.), Analysis of Large and Complex Data2016

Author(s)

Total Pages

Publisher

菰田文男埼玉学園大学, 経済経営学部, 教授 (60116720)

[Presentation] マーケティングデータにおける非対称性の分析-Web上のマーケティング・コミュニケーションデータの分析-2016

[Presentation] クラスタ中心を再計算しない大規模データのための非階層的クラスタリング2016

[Book] The Classification and Visualization of Twitter　Trending Topics Considering Time Series Variation. In F.2017

[Book] 調査に従事する人々のための統計学応用講座　第4版2016