研究課題/領域番号 |
24520173
|
研究機関 | 明海大学 |
研究代表者 |
矢島 ますみ 明海大学, 経済学部, 准教授 (80220135)
|
研究分担者 |
前田 利之 阪南大学, 経営情報学部, 教授 (70320041)
|
キーワード | 舞踊小唄 / テキストマイニング / 形態素解析 / クラスター分析 |
研究概要 |
本年度は、昨年度行ったフィージビリティスタディとしての、テキストマイニングによる 歌詞の作家による傾向の抽出・分類の可能性の検証をうけ、以下の分析をおこなった。すなわち、自立語の出現頻度を比較して、舞踊小唄、一般小唄それぞれに特徴的な語彙が使われているかどうかを調べた。具体的には、昨年度の分析対象であった、西条・平山の舞踊小唄に加えて、一般小唄の歌詞テキスト(120曲)を電子データ化して、テキストマイニングの手法をもちいて分析を試みた。その結果として、まず比較的単純な分析である形態素頻度情報を用いたクラスター分析においては、平山・西條・一般という3つのクラスターには分離されたものの、西条と一般小唄のほうが平山と西條よりも近いという結果となり、さらなる分析が必要となった。それをうけて、 tf/idf (Term Frequency / Inverse Document Frequency) による分析を行うと3クラスターが分類できることが確認できた。また更に、単なる形態素頻度情報ではなく bi-gram (2単語のペアを分析対象とするもの)を対象としたクラスター分析をおこなうと、一部歌謡小唄のノイズはあったものの、舞踊小唄と一般小唄のクラスタリングが出来ることが確認された。ただ、本年度計画していた、研究の対象となる歌詞が昭和初期のものであることを考慮したテキストマイニングにおける形態素分析ツール、特に辞書部分についての対応についてはまだ進んでおらず、今年度の課題である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
分析作業についてはおおむね順調に進んでおりいくつかの成果は得られている。ただし、ツール整備の部分が未着手である。
|
今後の研究の推進方策 |
まず辞書の整備を含んだ小唄分析に最適化されたツールの整備を目指す。その上で、昨年度取り組んだ舞踊小唄と一般小唄についての差異をさらに深く分析する。具体的には、対応分析をおこない、舞踊小唄、一般小唄それぞれのカテゴリーの関連性を調べる。上の出現頻度を調べた結果をうけ特徴的な語彙について、この対応分析を行うことで、特徴パターンを抽出できると考える。
|
次年度の研究費の使用計画 |
直接会合での打ち合わせ回数が少なかった。 本年度は打ち合わせ回数を確保し、研究を促進する。
|