研究課題/領域番号 |
23700288
|
研究機関 | 東洋大学 |
研究代表者 |
鈴木 崇史 東洋大学, 社会学部, 講師 (70507037)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 計算文体論 / 計量情報学 / 情報図書館学 / 人文情報学 / テキスト分析 |
研究概要 |
本研究では、大量かつ多種のメディアからテキストデータを収集、電子化し、これを計算文体論アプローチを用いて分析することで、多様なメディアにおける人々のコミュニケーションの在り方を実証的に明らかにすることを目的として研究を開始した。 研究開始年度にあたる平成23年度は、多種メディアテキストを収集、電子化を中心として研究を行った。Blog、Twitter、Q&Aコミュニティ、政治演説、新聞、雑誌、小説、歌詞、映画レビュー、漫画等、多種のデータをクロールおよび人手により収集、電子化するとともに、既存のデータセットを入手、利用した。 同時に、これら入手したデータについてテキスト特徴量を抽出し、特徴分析を行った。より具体的には、以下の成果を得た。1. 日本の総理大臣演説から国名に関する特徴量を抽出し、外交関係に関する知見を得た。2. アメリカ大統領演説に関して特徴分析を行い、テキスト特徴量に影響を与える主要因を明らかにした。3. フォロワーが多いユーザーのTweet、RTされやすいTweetについて特徴分析を行い、伝播されやすい情報の特徴を明らかにした。4. 女性シンガーソングライターの歌詞の特徴分析を行い、時代による変化、歌手ごとの特徴を明らかにした。以上、交付申請書に記載した「平成23年度の研究計画・方法」に記載した事項について予定通りの成果を得ており、また、「平成24年度の研究計画・方法」に記載した事項についても一部成果を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
「研究の目的」に記載した、大量、多種、テキストデータの収集、電子化、計算文体論アプローチによる分析、その他の点について、「平成23年度の研究計画・方法」通りの成果が得られている。加えて、「平成24年度の研究計画・方法」に記載した事項についても、一定の研究成果が得られている。
|
今後の研究の推進方策 |
基本的には、交付申請書「平成24年度の研究計画・方法」に記載した通りである。これに加えて、テレビ番組・漫画・アニメ等から抽出したデータをコーパスに加え、また、国立国語研究所が提供するKOTOHANA「現代日本語書き言葉均衡コーパス」を利用することでさらなる研究の進展をはかる。
|
次年度の研究費の使用計画 |
研究計画書、交付申請書に記載した内訳の他、平成23年度分の繰り越し分を物品費、旅費、謝金、その他に振り分け使用する。繰り越し分については、新たに採択された他の研究プロジェクトとの関係、また、国内、国際会議の日程等により平成24年度に繰り越したものであり、研究計画に大きな変更はない。
|