• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

ストリームデータに対するテキストマイニング・ツールの適用に関する研究

研究課題

研究課題/領域番号 15650014
研究機関東京工業大学

研究代表者

飯島 淳一  東京工業大学, 大学院・社会理工学研究科, 教授 (80151223)

研究分担者 包 捷  東京工業大学, 大学院・社会理工学研究科, 助手 (00345381)
キーワードテキストマイニング / データマイニング / 時系列データ / アソシエーションルール / 音楽 / 販売データ / スペクトル分析
研究概要

今年度の研究実績は大きく2つに分けることができる。
1.平成15年度は,MIDIデータをテキストに変換する方法について,様々な条件での実験を行い,結論として,音長を70チックから119チックごとに,sからzまでの英文字に対応させ,また,音高については,前の音との差分値をとり,半音高くなるごとに+1,半音低くなるごとに-1と定義し,-12から+12までをaからyまでの文字に対応させることとした。
これにもとづき,1990年以降の日本で発売されたポピュラーミュージック672曲のMIDIファイルをテキスト化し,テキストマイニングツールを用いて,検索や分類などの実験を行った。その結果,以下のことが判明した:
1)各々3つのサブクラスタを持つ,5クラスタに分けたところ."小室哲哉"の局はクラスタ1に,"つんく"の曲はクラスタ2に入ることが.統計的に有意であることがX^2検定の結果,示された。
2)1993年から2002年までのオリコンチャート50位以内に入った曲について分析したところ,各クラスタの時代による流行廃りを分析することができ,特にクラスタ4,5の曲については,1998年以降増加していることが明らかになった。
なお.これとは別に,MIDIデータではなく,スペクトログラムにもとづくマイニングについても行い,比較検討している(文献1)。
2.ストリームデータとは,"流れ"のあるデータのことであり,販売に関する時系列データも,ストリームデータと考えることができる。そこで,上記3)に示すような時系列による変化の分析に焦点を当て,花き卸データを対象として,2001年から2003年まで,いずれも5月期における花き卸販売データ(各々約40万件)を対象に,サポートと確信度の相対的変化にもとづき,アソシエーションルール(A⇒Bという形式のルール)分析を試みた。これにより,花き卸の専門家が直観的に感じていたことを,データマイニングの手法を用いることにより裏付けることに成功した。(文献2)

  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 松田 卓久: "スペクトログラムにもとづく音楽情報へのマイニング技術の適用"東京工業大学・大学院社会理工学研究科経営工学専攻 平成15年度修士論文(指導教官:飯島淳一). 1-87 (2004)

  • [文献書誌] 松野 正憲: "アソシエーション・ルール群の時系列変化に対する評価方法についての研究"東京工業大学・工学部経営システム工学科 平成15年度卒業論文(指導教官:飯島淳一). 1-42 (2004)

URL: 

公開日: 2005-04-18   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi