研究課題/領域番号 |
15K21592
|
研究機関 | 香川高等専門学校 |
研究代表者 |
奥村 紀之 香川高等専門学校, 情報工学科, 講師 (40510277)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
キーワード | 性格推定 / 感情推定 / 顔文字 |
研究実績の概要 |
本年度は、オンラインでの振る舞いから想定される性格に関して、人工知能学会,言語理解とコミュニケーション研究会ならびに国際会議KEODにおいて成果報告を行っている。これらの報告では、オンライン資源からの性格推定を行う場合,BlogやTwitterをその対象とするが、それぞれの媒体がどのような傾向にあるかを分析している。特にTwitterを素材とする場合、感情を有する表現がBlogよりも多く含まれる傾向に有り、感情推定アルゴリズムと性格推定との親和性が高いことが傾向として現れている。 また、既存の感情推定アルゴリズムは対応できる語彙数に制約があり、固有名詞や新語を多数有しているオンライン資源を利用する場合、適切に語の情報を取得できない問題がある。これに対し、大規模な概念ベースを構築することによって対応することとし、国際会議KES2016において研究協力学生が報告予定である。特に、感情推定のための連想基盤として概念ベースを構築しており、従来の概念ベースと比較しても連想精度として遜色のないものを自動構築することに成功しており、対応可能な語彙数を12万語から130万語へとおよそ10倍の拡張を行っている。 感情推定アルゴリズムは主として文字情報にのみ着目していることから、文字のみでは抽出できないような細かな感情を取りこぼすことがあった。そこで、文字情報の補足情報として付与されている顔文字に関する大規模な知識ベースを構築し、感情推定アルゴリズムの拡張を考えている。顔文字の分析に関しては、およそ40000種の顔文字に対してタグ付けを行い、顔文字の原形を定義することによって、今後も増え続けると予想される顔文字を効率的に扱うための基盤を構築している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成27年度の研究活動については、ほぼ当初の予定通り進行している。主題である性格推定に関しては、TwitterもしくはBlogのいずれが感情推定アルゴリズムとの親和性が高いかを検討しており、処理対象のオンライン資源を決定するとともに、その傾向を抽出できている。 また、感情推定アルゴリズムに関しては、従来からの問題である語彙数に関して、WikipediaやEDR電子化辞書を用いて概念ベースを自動構築することによって、連想基盤としての性能を落とすことなく語彙数を拡充することに成功している。さらに、文章から適切に勘定を取得できない場合においても、顔文字を考慮することによって補足情報を付与し、感情を推定できるよう拡張している。 特に顔文字に関しては、他の研究では見られない大規模な分析を進めており、知識ベースの公開を求められている状況にある。周辺研究者へ与える影響を考慮しても、十分に研究が進められていると考えられる。 しかし、懸念材料として、平成28年度から所属が変わり、研究設備を満足に利用できる環境ではなくなっているところに大きな問題がある。現状として、遠隔操作でサーバシステムを利用しているが、故障が相次いでおり、手元に研究設備がないことから復旧作業等に時間を要している状況である。 研究設備を現任校へ移設することが決定し前任校と現任校の間で調整が完了していたが、急遽移設が認められなくなってしまったため、大規模な計算を行うための機器を効率的に使用できない状況である。現在も移設に関して交渉を進めている段階ではあるが、本課題が終了するまでに対応可能かどうかが分からず、その点を考慮して研究を進めていく必要がある。
|
今後の研究の推進方策 |
実績の概要や進捗状況で述べたとおり、研究活動はおおむね順調に進んでいる。性格推定に関しては、他機関においても活発に研究が進められており、アプリケーションとして公開されているものもいくつか存在している。そのため、それらの技術と本研究で目指している性格推定の技術の相違点に着目しながら研究を進めていく。 感情推定に関しては、大規模な顔文字の知識ベースが完成してきているため、既存のアルゴリズムと合わせて、より人間らしい感情推定を行うためのソフトウェア開発が今後の課題である。特に、日本語の環境においては、英語やドイツ語と異なり、空気を読む、察するといった能力が大きな影響を及ぼす。その一助となるべく顔文字が付与されており、言外情報を効率的に扱えるアルゴリズムの開発を目指す。 本年度は本課題の最終年度であるため、年度の前半はシステム・アルゴリズム開発を進め、後半には国際会議や論文誌への投稿ができるよう、データのまとめを行っていく。性格推定に関しては、人工知能学会や言語処理学会のみならず、日本心理学会などの分野にも投稿できるように進めていきたい。 なお、本研究では大規模なテキストデータの解析が必須であるが、進捗状況で述べたとおり、当初予定していた研究設備を効率的に使うことが難しい環境にある。そのため、小規模実験での代替処理を行うか、小規模設備での効率的な分析を可能とするアルゴリズムの開発を行うか、検討していく必要がある。現時点においては、効率的なアルゴリズム開発の方に力を入れており、可能な限り前処理を行った上での分析を進められるようにしていきたい。
|