研究課題/領域番号 |
25880003
|
研究種目 |
研究活動スタート支援
|
研究機関 | 北見工業大学 |
研究代表者 |
プタシンスキ ミハウ 北見工業大学, 工学部, 助教 (60711504)
|
研究期間 (年度) |
2013-08-30 – 2015-03-31
|
キーワード | 自然言語処理 / 感情解析 / コーパス分析 / パターン抽出 / 感情表現 |
研究概要 |
感情表現辞典の拡大化,文パターン抽出 感情を考慮した言語モデルを構築するために,まず現在の感情表現辞典の更新・拡張をした.またそれを基にブログコーパスの感情タグを更新・フィルタリングを行い,コーパスから有効な文パターンを抽出した. (1) 感情表現辞典の拡大化.感情タグ更新・フィルタリング 日本語の感情表現辞典には,現在使用されていない表現もあれば,インターネットで頻繁に使われているものの本辞典に含まれていない表現もある.使われていない表現のフィルタリングを行うためには,共起頻度計算手法を用いて各表現がコーパス内に使われるか確認した.また,新しい表現を抽出するためには,感情表現を含むサンプル文から以前開発したSPEC文パターン抽出システムを用いて,感情文パターンを抽出した.さらにすべての文内には同じパターンに囲まれた表現を新規感情表現と考えた.感情解析システムに応用し再評価を行い,性能向上を確認した. (2) 文パターン抽出・統計的特徴の分析 大規模ブログコーパスより,ブログ記事とコメントの関係を維持したまま,SPECを用いて会話文パターンを抽出した.その抽出結果から,文法情報パターンと感情情報パターンを個別に抽出した.また,抽出したパターンの評価を行った.ブログ記事とコメントに現れる文パターンの分析及び評価を行い,パターンの有効性を確認した.こうして得られた有効なパターンは一つの会話ストラテジーと考える.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究は当初計画以上に進展している.研究計画の内容を達成した上で,文パターン抽出手法SPECを応用し,感情表現のみならず,将来言及表現の抽出,ユーザプロファイル作成などのタスクに応用ができた.さらに,当初計画では考慮しなかったが,うつ病患者の話し方(特徴的な表現など)を分析を行っている.それらをネットいじめ対策研究に応用することで,ネット上のいじめを含む文・文書を検出するのみならず,いじめに悩みうつ病にかかり始めているユーザを特定することができ,当初計画より多次元の分析を行うことが可能になる見込みである.
|
今後の研究の推進方策 |
今後はこれまで収集した会話ストラテジーや文パターンからなる言語モデルを評価する.そのため対話エージェントに導入し,ユーザによる主観評価を行う.被験者を最低1組10人,4組(計40人)と考える.また,評価から分かった弱点を改善し,ネット上のいじめ対策研究に応用する.
|