• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2003 Fiscal Year Annual Research Report

ストリームデータに対するテキストマイニング・ツールの適用に関する研究

Research Project

Project/Area Number 15650014
Research InstitutionTokyo Institute of Technology

Principal Investigator

飯島 淳一  東京工業大学, 大学院・社会理工学研究科, 教授 (80151223)

Co-Investigator(Kenkyū-buntansha) 包 捷  東京工業大学, 大学院・社会理工学研究科, 助手 (00345381)
Keywordsテキストマイニング / データマイニング / 時系列データ / アソシエーションルール / 音楽 / 販売データ / スペクトル分析
Research Abstract

今年度の研究実績は大きく2つに分けることができる。
1.平成15年度は,MIDIデータをテキストに変換する方法について,様々な条件での実験を行い,結論として,音長を70チックから119チックごとに,sからzまでの英文字に対応させ,また,音高については,前の音との差分値をとり,半音高くなるごとに+1,半音低くなるごとに-1と定義し,-12から+12までをaからyまでの文字に対応させることとした。
これにもとづき,1990年以降の日本で発売されたポピュラーミュージック672曲のMIDIファイルをテキスト化し,テキストマイニングツールを用いて,検索や分類などの実験を行った。その結果,以下のことが判明した:
1)各々3つのサブクラスタを持つ,5クラスタに分けたところ."小室哲哉"の局はクラスタ1に,"つんく"の曲はクラスタ2に入ることが.統計的に有意であることがX^2検定の結果,示された。
2)1993年から2002年までのオリコンチャート50位以内に入った曲について分析したところ,各クラスタの時代による流行廃りを分析することができ,特にクラスタ4,5の曲については,1998年以降増加していることが明らかになった。
なお.これとは別に,MIDIデータではなく,スペクトログラムにもとづくマイニングについても行い,比較検討している(文献1)。
2.ストリームデータとは,"流れ"のあるデータのことであり,販売に関する時系列データも,ストリームデータと考えることができる。そこで,上記3)に示すような時系列による変化の分析に焦点を当て,花き卸データを対象として,2001年から2003年まで,いずれも5月期における花き卸販売データ(各々約40万件)を対象に,サポートと確信度の相対的変化にもとづき,アソシエーションルール(A⇒Bという形式のルール)分析を試みた。これにより,花き卸の専門家が直観的に感じていたことを,データマイニングの手法を用いることにより裏付けることに成功した。(文献2)

  • Research Products

    (2 results)

All Other

All Publications (2 results)

  • [Publications] 松田 卓久: "スペクトログラムにもとづく音楽情報へのマイニング技術の適用"東京工業大学・大学院社会理工学研究科経営工学専攻 平成15年度修士論文(指導教官:飯島淳一). 1-87 (2004)

  • [Publications] 松野 正憲: "アソシエーション・ルール群の時系列変化に対する評価方法についての研究"東京工業大学・工学部経営システム工学科 平成15年度卒業論文(指導教官:飯島淳一). 1-42 (2004)

URL: 

Published: 2005-04-18   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi