2014 Fiscal Year Research-status Report
意味理解に基づくマイクロブログのチャット的メッセージの分析・構造化に関する研究
Project/Area Number |
24500296
|
Research Institution | Okayama Prefectural University |
Principal Investigator |
菊井 玄一郎 岡山県立大学, 情報工学部, 教授 (80395011)
|
Co-Investigator(Kenkyū-buntansha) |
但馬 康宏 岡山県立大学, 情報工学部, 准教授 (00334467)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | ウエブマイニング / マイクロブログ / テキスト解析 / 自然言語処理 |
Outline of Annual Research Achievements |
計画に従い,マイクロブログ向けの係り受け解析の精度向上に関する検討および必要なコーパスの整備を行った.また,マイクロブログの書き手の行動分析については書き手の感情を8分類したラベルを付与する手法を検討した. 1)係り受け解析(計画書項目C):(文節)係り受け解析の過程は大きく文節境界の推定と係り先推定に分けられる,前者については昨年度に引き続いて系列ラベリング手法を適用することとし,素性,および,系列単位の検討を行った.その結果,系列単位として従来の形態素から文字に変えることなどにより精度が向上することが分かった.また,係り先推定については1文あたりの文節数が少ないこと,および,後続する文節に係るケースが多いことなどから手法による差異が小さいことが分かった.以上より,マイクロブログにおける文節係り受け解析は文節境界の推定が極めて重要であること,および,上記提案手法により精度が向上することが明らかになった(言語処理学会第21回年次大会,2015.3) 2)マイクロブログの分析(研究項目D):マイクロブログの分析については書き込みから書き手の感情(主観的評価)を推定する問題に取り組んだ.本研究では感情のラベルとして標準的なPlutchik(1962)の8分類を用い,書き込みに対してどの分類に該当するかをを二段階で推定する手法を提案した.( International Conference on Parallel and Distributed Processing Techniques and Applications PDPTA'14, pp.189--194,2014.)
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
計画にあげた項目のうち「項目C:係り受け解析」について文節境界推定精度が全体の解析精度を決定づける主要因であることが分かったため,これに対するエラー分析,改良を優先した.このため,「書き手の行動分析(D)」についてその一部が未検討となった.
|
Strategy for Future Research Activity |
次年度については当初計画において積み残しとなった項番D(書き手の行動分析)を実施するとともに,昨年度の研究により重要性が明らかになった文節境界推定の精度向上について特に助詞落ちの補完を含む手法の検討を進める.
|
Causes of Carryover |
H26年度にはマイクロブログの係り受け解析処理の高精度化を行ったあと,この処理を用いた書き手の行動分析を行う予定であった.しかしながら,前者において,文節境界推定で全体精度がほぼ決まってしまうことが明らかになったため,計画を変更し,文節境界推定処理の精度向上に向けた各種実験を優先した(この成果はH27年3月に言語処理学会年次大会で報告した).そのため未使用額が生じた.
|
Expenditure Plan for Carryover Budget |
前記より当初計画で積み残しとなった,係り受け解析の論文投稿,および,マイクロブログの書き手の行動分析の研究および発表を次年度に行うこととし,未使用額はその経費に充てる計画である.
|