研究課題/領域番号 |
17K20028
|
研究機関 | 名古屋大学 |
研究代表者 |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
研究期間 (年度) |
2017-06-30 – 2019-03-31
|
キーワード | テキスト生成 / 日本語生成 / 自然言語処理 |
研究実績の概要 |
本年度は、HaoriBricksの設計と実装を行なった。 (1)HaoriBricksの基盤となる文法体系(羽織文法)の全体設計を行うとともに、それに基づく文構造(羽織構造)の設計を行なった。羽織構造は、終端ノードが形態素・語に対応し、非終端ノードが言語構造に対応する木構造である。表層文字列はこの羽織構造から生成される。この生成過程に、活用やテンス付与の処理を組み込み自動化した。これを実現するために、活用体系・接続体系を詳細に定義した。 (2)HaoriBricksによるテキスト生成は、あらかじめ準備されたブロックを組み合わせることで実現される。ユーザーによって指定されたブロックの組み合わせは、ブロック構造として内部的に保持され、表層化命令によって羽織構造に変換され、最終的に表層文字列に変換される。 (3)HaoriBricksは、22種類の基本ブロックと、それを組み合わせて定義されるマクロブロックにより構成される。これらを用いて、日本語の基本的な構文構造、および、中核的な付属語・機能表現をマクロブロックとして実装した。これらを用いて、益岡・田窪の『基礎日本語文法-改訂版-』の例文のほとんどをHaoriBricksにより生成できることを確認した。 (4)テキストを生成するためのHaoriBricksのコードをより簡便に記述できるようにするため、羽織構造を変形する機能を導入した。この機能を利用して、述語の取り立て変形を行うブロックを設計・実現した。また、話し言葉の生成を可能にする準備として、「めんどくさい/めんどくせえ」「わるい/わりい」のような話し言葉固有の音変化現象の調査と分類を行なった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
HaoriBricksは、研究室内ではすでに使える状態となっており、第5回星新一賞への応募作品の制作や、小説会話文の自動生成や広告コピーの自動生成などにも使用され始めている。その点では当初の予定よりも進んでいるが、これまで実装において試行錯誤を重ねてきたため、システムの整理と再実装が必要となっている。そのため、全体としては「おおむね順調」というレベルだと考えている。
|
今後の研究の推進方策 |
今後は、次の2点を進める予定である。 (1)これまでに実現できている部分については、システムの保守を容易にするために、プログラムの整理と再実装を進める。特に、現在一体化している機能語の辞書と機能語のブロックを分離し、語彙的情報(辞書)をより精密に記述できるようにする。 (2)システムを特定の目的用に拡張するモジュールを実装する。特に、発話を生成するための機能(発話者毎に話し方のスタイルを変更できる機能)と、広告コピーを生成するための機能(丁寧な表現を生成する機能)などの実現を検討する。
|
次年度使用額が生じた理由 |
本年度は、予定していたよりも消耗品費がかからず、また、論文執筆まで研究が進まなかったため、物品費とその他で残額が生じた。次年度では、これらの残額を合わせ、人件費・謝金と物品費を当初計画よりも増額して執行する。
|