2011 Fiscal Year Research-status Report
Project/Area Number |
23653142
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
中野 康人 関西学院大学, 社会学部, 教授 (50319927)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 計量テキスト分析 |
Research Abstract |
【内容】平成23年度は,(1)1980年代以前の読者投稿欄の電子テキスト化の方法を模索するとともに,(2)形態素解析ソフトの整備を行った.また,(3)新聞社の読者投稿欄担当者とは電子メイルでの取材を行った.(1)について.1980年代以前の新聞記事は電子媒体でテキスト化されておらず,紙媒体や電子画像からテキストを効率的に抽出する方法を模索した.OCRによる自動テキスト化と手入力によるテキスト化を比較検討した.結果的に,人力による手入力に頼るのが正確で効率的であるという結論に至った.(2)について,形態素解析ソフトおよび辞書のチューニングを行った.投稿者の職業名称や頻出する投稿内容について,既存の辞書では抽出できない単語を拾い上げ,辞書登録の作業を繰り返した.(3)について,複数の新聞社の読者投稿欄担当者にコンタクトをとり,この研究の概要を説明するとともに,読者投稿欄編集過程の取材を行った.【意義】本研究の主目的は,読者投稿のデータベースを構築し,その内容分析を行うことにある.1980年代以前の新聞記事データは,紙媒体もしくは画像形式の電子媒体でのみ蓄積されており,データベースの構築には電子テキスト化の作業が必須となる.そのためまずは複数の作業方法を比較して尤も効率的な方法を確立することが研究を効率的に進める上で肝要となる.また,投稿内容のテキストから正確に意味内容を抽出し,統計的に分析していく為には,平文を単語に分割する形態素解析の作業が必須となる.分析の対象となる記事データの文章にもとづいて,辞書をチューニングすることは,最終的な分析作業をする前に欠かせないことである.読者投稿を世論の「覗き窓」として解釈する場合,その投稿記事が新聞社によって如何に選別され改編されるのかを知ることは,投稿者の意見の立ち位置を知るためには重要なポイントとなる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予算上限が不確定だったこともあり,前半は予算執行に関して慎重な研究活動を実施した.当初の計画では,年度当初から大規模にデータ入力作業を行う予定であったが,まずはデータ作成方法の検討からとりかかった.
|
Strategy for Future Research Activity |
2012年度は,前年度にデータ入力の準備が整ったので,積極的にデータベースの作成にとりかかる.同時に,その内容分析と新聞社への取材をすすめていく.
|
Expenditure Plans for the Next FY Research Funding |
当初の予定では大量のデータ入力を行う予定であったが,データ作成方法の検討に時間を費やしたため、2011年度に執行予定であったデータ入力に関する人件費は2012年度に繰り越した.2012年度の研究費は,前年度からの繰り越し分も含めて、主にデータ入力の為の人件費と,新聞社への聞き取り調査のための旅費に充てられる.
|
Research Products
(4 results)