研究課題/領域番号 |
22530261
|
研究機関 | 埼玉大学 |
研究代表者 |
菰田 文男 埼玉大学, 経済学部, 教授 (60116720)
|
キーワード | 選択と集中 / 日本企業 / 技術経営 / テキストマイニング / データマイニング / 社内技術共有 / データベース / 特許公報 |
研究概要 |
第2年目の本年度は、主として2つの作業をおこない、研究のベースを確立した。 第1に、Salesforce社のレンタルサーバー上に「書き込み空間を持つ知識創出・共有システム」を構築し、オリジナルなテキストデータに「コメント」「リンク先」等の付加価値を与える仕組みを提示した。これに特許公報をインポートし、知識共有に有効であることを確認した。 第2に、研究室にサーバーを立ち上げ、IBM社のテキストマイニングツールであるContent Analyticsをインストールし、テキストデータの統計解析のためのインフラを確立した。 以上の二つのシステムに、過去10年余の太陽電池、電気自動車等の特許公報をインポートし、さらに付加価値を与えることによって得られたテキストデータをマイニングした。さらに、マイニング手法として、一般に用いられる多変量解析ではなく、アソシエーションルールとネットワーク分析を適用した。データマイニング一般と異なり、テキストデータの統計解析はロングテールデータのテール部分から「出現頻度の低い重要単語」を発見するという困難があるので、これを克服するためにアソシエーションルールで単語セットを進化させることによって出現頻度の少ない重要単語を発見し、さらにネットワーク分析の「密度」や「クリーク」発見のための手法を適用することによってこの進化が適切であるかどうかを検証することが有効だからである。この成果は、情報通信学会で報告され、さらに科学技術振興機構『情報管理』誌に発表された。 このような作業と並行して日本企業の選択と集中の実態について、多くの文献や報告書にもとづいて整理した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は、リレーショナルデータベースを使って書き込み空間を持つ知識共有システムを構築し、またテキマイニングツールをインストールして、特許公報を実験的に統計解析することが目標であった。この目標を達成し、学会報告と研究論文の刊行をおこなうことができた。
|
今後の研究の推進方策 |
本年度の研究で確認されたことは、テキストデータから「意味」を発見し、企業の選択と集中のための意志決定に役立てるためには、研究開始時点での予想通りであるが、(1)オリジナルデータに付加価値を持たせて「意味」の発見を容易にする作業が必要である、(2)統計解析手法をストレートに適用しても「意味」発見は難しいので「単語セット」の作成と進化というステップを踏まえることが必要である、という2点が確認された。その意味で研究方法の修正等の必要か感じられないが、しかし特許公報に限らず多様なテキストデータを用いてさらに研究を積み重ねることが不可欠であると考えている。
|