2014 Fiscal Year Annual Research Report
江戸小唄の中の舞踊的身体-テキストマイニングによる小唄と舞踊小唄の特徴比較研究
Project/Area Number |
24520173
|
Research Institution | Meikai University |
Principal Investigator |
矢島 ますみ 明海大学, 経済学部, 教授 (80220135)
|
Co-Investigator(Kenkyū-buntansha) |
前田 利之 阪南大学, 経営情報学部, 教授 (70320041)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 舞踊小唄 / テキストマイニング / 形態素解析 / クラスター分析 / bi-gram |
Outline of Annual Research Achievements |
昨年度は、自立語の出現頻度を比較して、舞踊小唄、一般小唄それぞれに特徴的な語彙が使われているかどうかを調べた。具体的には、初年度の分析対象であった西条八十・平山蘆江の舞踊小唄に加えて、一般小唄の歌詞テキストを電子データ化して、テキストマイニングの手法をもちいて分析を試みた。 更に、単なる形態素頻度情報ではなく bi-gram(2単語のペアを分析対象とするもの)を対象としたクラスター分析をおこなうと、一部歌謡小唄のノイズはあったものの、舞踊小唄と一般小唄のクラスタリングが出来ることが確認された。 しかし、研究の対象となる歌詞が昭和初期のものであることを考慮したテキストマイニングにおける形態素分析ツール、特に辞書部分についての対応についてはまだ進んでおらず、課題でとなっていた。 そこで本年度は、辞書の対応として、「小唄ことばの手引 (吉田 忠 (編) 」「小唄ことば辞典(上村幸以)」を電子データ化した。方法としてはスキャナーでスキャン後、OCRソフトによりテキスト化を行い、一部については人手により確認および修正の作業をおこなった。その上で、形態素解析システム MeCab 用ユーザ辞書形式に変換しシステムに組み込んだ上で、再度分析を行った。 その結果、名詞・動詞・形容詞に絞った上で bi-gram を対象としたクラスター分析をおこなうと、舞踊小唄と一般小唄のクラスタリングが出来ることが確認された。さらに舞踊小唄についても、西条・平山の作詞家別のクラスタリングも出来ており、本研究の重要な成果となった。
|
Research Products
(1 results)