研究課題/領域番号 |
18K18504
|
研究機関 | 静岡大学 |
研究代表者 |
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
|
研究期間 (年度) |
2018-06-29 – 2021-03-31
|
キーワード | 自然言語処理 |
研究実績の概要 |
本研究の第一の目的は、より人間に近いモデルを採用することで、人間のように自然な「間」を自動的に生成することである。たとえば人間同士であれば、「お互いに発話しかけて譲りあいどちらも話し始められない」といったシーンがみられるが、既存システム同士ではこれを本質的に再現できていない。また近年の多くの研究では、書き言葉を主眼においている点、統計的手法の隆盛により、書き言葉を前提に大規模データと潤沢な計算資源を用いた処理が行われてきた。一方で人間のほうが高精度であるだけでなく、計算量も少ないであろうことは、古くから心理学的実験により知られている。こうした点を踏まえ、心理学的に妥当なモデルにより解析器を構築する。相槌および会話中の割込タイミングを、この解析器を用いて自動的に推測することを目標とし、その判断基準となる手がかり(特徴量)の発見と分析を行うことが第二の目的である。 本年度は、心理学的な制約を取り入れかつ解析可能(ホワイトボックス)な設計により、解析候補数を限定しつつ逐次処理を行うモデルを採用し、音声処理とテキスト処理を統合したアプローチによりリアルタイムで動作するシステムを構築した。少ない候補数で高い精度を維持するには、異なるレイヤーの情報が必要である。音声、音素から形態素、品詞、係り受けまで統合した解析器を、この制約の枠組み内で構築した。これまでの研究で構築してきたテキストの逐次処理統合解析器を一部援用して、文字単位のテキスト入力を前提としているこの統合解析器について、音素単位での入力を行えるよう改良した。 そのほか、最終的なシステム統合を念頭に、アクセントの分析、相槌タイミングの分析などの研究を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
心理学的な制約を取り入れかつ解析可能(ホワイトボックス)な設計により、解析候補数を限定しつつ逐次処理を行うモデルを採用し、音声処理とテキスト処理を統合したアプローチによりリアルタイムで動作するシステムを構築した。さらに、音声、音素から形態素、品詞、係り受けまで統合した解析器を、この制約の枠組み内で構築した。これまでの研究で構築してきたテキストの逐次処理統合解析器を一部援用して、文字単位のテキスト入力を前提としているこの統合解析器について、音素単位での入力を行えるよう改良した。そのほか、最終的なシステム統合を念頭に、アクセントの分析、相槌タイミングの分析などの研究を進めた。 これらの進捗から、初年度の目標はおおむね達成した。
|
今後の研究の推進方策 |
想定よりも性能向上のために必要な要素が多く見えてきたため、データの種類やアノテーションの付け方など、次年度以降の研究が予定と変わってくる可能性がある。
|
次年度使用額が生じた理由 |
想定よりもデータ作成費用が少なかったため。次年度使用分は、あらためてデータ作成費用に充てる。
|