研究課題/領域番号 |
16K01267
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
社会システム工学・安全システム
|
研究機関 | 湘南工科大学 |
研究代表者 |
鈴木 誠 湘南工科大学, 工学部, 教授 (80339796)
|
研究分担者 |
三川 健太 湘南工科大学, 工学部, 准教授 (40707733)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2017年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2016年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 多言語処理 / 感情極性辞書 / テキストマイニング / N-gram / 単語抽出 / 単語切り出し / 自動抽出 / 自動分割 |
研究成果の概要 |
本研究では、Unicodeで表現された複数の言語が混在するテキストデータを、同一のプログラムで処理する単語分割技術を構築した。この技術は、単純な状態遷移モデルに基づいた、各言語の辞書や文法知識を一切必要としない言語独立な単語分割方式である。主に、(1)処理対象となる言語の拡張、(2)適用事例の拡張、の2つの方向性を意識して研究を進めた。(1)については、日本語以外にも日本語の古典や英語、中国語、韓国語などの外国語に対しても有効であることが確認できた。(2)については、商品や施設のユーザレビューを用いて感情極性辞書を自動的に作成する手法を提案することができた。
|
研究成果の学術的意義や社会的意義 |
本研究では、対象のレビューデータをもとに感情極性辞書を自動的に作成する手法を提案することができた。感情極性辞書とは、文章に含まれる単語に対し、文中に含まれる特有の極性(ポジティブ、ネガティブ)を持つ単語が含まれているという考えに基づき、単語に対し極性値を与えた辞書である。今回は商品や施設のユーザレビュー(5段階の評価値付きのテキストデータ)を用いて、評価値に基づいて感情極性値を算出することにより、感情極性辞書を自動的に作成する手法を提案した。これにより、コンピュータが自動的にユーザレビューを収集し、ある商品や施設に特化した感情極性辞書を構成できる可能性を示唆することができた。
|