2019 Fiscal Year Annual Research Report
日本語文章の構造モデルとその段階的詳細化による文章自動生成機構
Project/Area Number |
18H03285
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 文合成ソフトウェア / 文章の自動生成 / 広告シナリオの自動生成 / 文末述語解析 / 接続詞補充問題 |
Outline of Annual Research Achievements |
本年度は、主に、以下の研究を実施した。 (1)文合成ソフトウェアHaoriBricks3の機能を強化した。具体的には、述語の活用型の自動推定を実現するとともに、サポートするブリック(部品)を大幅に拡充した。 (2)通信販売商品のTV60秒広告のシナリオを自動生成するシステムを強化した。このシステムでは、シナリオ型として、大分類で11種類、詳細分類では30種類を実装した。システムは、与えられたコンテンツ(内容記述)に対して、適用可能なシナリオ型を自動選択し、コンテンツを反映したシナリオを自動生成する機能を有する。システムは、ウェブサーバー上で動作し、ウェブブラウザーで動作するユーザーインタフェース(クライアント)を通して利用することができる。 (3)日本語文の文末の述語の範囲を同定し、それがどのような要素から構成されているかを分析する日本語文末解析器Panzerを実装した。日本語の述語は、おおよそ、核となる内容語(動詞・形容詞)に、接尾辞や助動詞等の付属要素が接続することによって構成されている。Panzerではこれらの付属要素を厳密に定義するとともに、211種類(432 エントリ)の述語複合辞(助動詞的に働く連語)を定義し、付属要素として認識できるようにした。Panzerの出力はHaoriBricks3で表層文に復元可能であるため、復元テストによる解析エラー検出が容易である。 (4)Panzerによる分割解析結果を利用して、文末述語を用いた2文間の接続関係推定を実装した。具体的には、入試で出題される接続詞補充問題(空欄を埋める適切な接続詞を選択する)を対象として、前後2文の文末述語の情報のみからどの程度推定できるかを調べた。既存の解析器を用いた場合と比較して、Panzerの解析結果を用いると、統計的に優位な性能向上が見られた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
TV60秒広告のシナリオの自動生成システムに関しては、少し方針を転換して作成支援システムを目指すことにしたため、システムの作り直しが必要となっている。
|
Strategy for Future Research Activity |
(1)TV60秒広告のシナリオの自動生成に関しては、現場での使用を想定し、作成支援システムの実現に舵を切る。そこでは、文章の作成支援に加えて、コンテンツの作成支援が重要となる。これを、新たに研究内容に含める。 (2)文章解析に関しては、文末述語解析技術の確立に注力する。特に、解析結果として何を出力すべきかを中心に、技術の成熟を目指す。
|
Research Products
(4 results)