2017 Fiscal Year Annual Research Report
Study on Practically Available Text Minning Technique Based on Kowledge Creation Tool
Project/Area Number |
15H03383
|
Research Institution | Saitama Gakuen University |
Principal Investigator |
菰田 文男 埼玉学園大学, 経済経営学部, 教授 (60116720)
|
Co-Investigator(Kenkyū-buntansha) |
井口 知栄 慶應義塾大学, 商学部(三田), 准教授 (20411209)
林 倬史 国士舘大学, 経営学部, その他 (50156444)
中山 厚穂 首都大学東京, 社会科学研究科, 准教授 (60434198)
荒井 将志 亜細亜大学, 国際関係学部, 講師 (70549691)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | テキストマイニング / データマイニング / 知の構造化 / BOPビジネス / 国際化 / 日本企業 |
Outline of Annual Research Achievements |
本研究の独自性は二つある。第一に多くのテキストマイニング研究がアルゴリズムのの研究に向かっているのに対し、本研究では企業の意思決定という実利用を目指しデータ解析手法の確立を目指す点である。第二にそのために従来の研究の多くが全体の鳥瞰図を描くことを主眼としているのに対し、本研究では企業の意思決定に必要な知識を持つために不可欠の部分を全テキストの中からピンポイントで発見し、それを結びつけることによって精緻な知識を得るための手法(ピンポイントフォーカス型テキストマイニング)の確立を目指す点である。 企業の実利用に資するための研究の素材として、日経BPや日本経済新聞の記事、EBSCOに収録された業界レポート、世界銀行のスタッフが執筆したブログ、日本の特許公報などを選んだ。目的を達成するためにさまざまなアプローチを模索したが、最終的にテキストを5文ごとに切り分けて「テキストブロック」を作成し、これをマイニングの単位とするというアプローチを選択した。その理由は、5文程度が意味の「塊」となっているからであり、また「基本句」を作成するのに適していると考えられるので、膨大なテキストデータの中から必要な部分のみを抽出し意味を発見するうえで最も有効であるという結論に達したからである。このようにテキストデータを前処理した上で、(1)テキストブロックを単位とした語の共起関係の解析、(2)テキストブロックから構文関係を有する基本句の作成、(3)テキストブロック間の結びつけをおこなうことによって、企業の意思決定に利用できるだけの精度の高い知識の獲得が可能となることを論じた。 この研究成果は林・菰田・中山「テキストデータの分析によるBOPビジネス動向の研究」、菰田「テキストマイニングに基づく日本企業国際化の研究」等として刊行され、さらに現在Springer社からの共同著作の刊行に向けて分析を継続中である。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|