• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

ブロック玩具をモデルとする日本語文章合成ツールキットの設計と実装

研究課題

研究課題/領域番号 17K20028
研究機関名古屋大学

研究代表者

佐藤 理史  名古屋大学, 工学研究科, 教授 (30205918)

研究期間 (年度) 2017-06-30 – 2019-03-31
キーワードテキスト生成 / 日本語生成 / 自然言語処理
研究実績の概要

本年度は、HaoriBricksの設計と実装を行なった。
(1)HaoriBricksの基盤となる文法体系(羽織文法)の全体設計を行うとともに、それに基づく文構造(羽織構造)の設計を行なった。羽織構造は、終端ノードが形態素・語に対応し、非終端ノードが言語構造に対応する木構造である。表層文字列はこの羽織構造から生成される。この生成過程に、活用やテンス付与の処理を組み込み自動化した。これを実現するために、活用体系・接続体系を詳細に定義した。
(2)HaoriBricksによるテキスト生成は、あらかじめ準備されたブロックを組み合わせることで実現される。ユーザーによって指定されたブロックの組み合わせは、ブロック構造として内部的に保持され、表層化命令によって羽織構造に変換され、最終的に表層文字列に変換される。
(3)HaoriBricksは、22種類の基本ブロックと、それを組み合わせて定義されるマクロブロックにより構成される。これらを用いて、日本語の基本的な構文構造、および、中核的な付属語・機能表現をマクロブロックとして実装した。これらを用いて、益岡・田窪の『基礎日本語文法-改訂版-』の例文のほとんどをHaoriBricksにより生成できることを確認した。
(4)テキストを生成するためのHaoriBricksのコードをより簡便に記述できるようにするため、羽織構造を変形する機能を導入した。この機能を利用して、述語の取り立て変形を行うブロックを設計・実現した。また、話し言葉の生成を可能にする準備として、「めんどくさい/めんどくせえ」「わるい/わりい」のような話し言葉固有の音変化現象の調査と分類を行なった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

HaoriBricksは、研究室内ではすでに使える状態となっており、第5回星新一賞への応募作品の制作や、小説会話文の自動生成や広告コピーの自動生成などにも使用され始めている。その点では当初の予定よりも進んでいるが、これまで実装において試行錯誤を重ねてきたため、システムの整理と再実装が必要となっている。そのため、全体としては「おおむね順調」というレベルだと考えている。

今後の研究の推進方策

今後は、次の2点を進める予定である。
(1)これまでに実現できている部分については、システムの保守を容易にするために、プログラムの整理と再実装を進める。特に、現在一体化している機能語の辞書と機能語のブロックを分離し、語彙的情報(辞書)をより精密に記述できるようにする。
(2)システムを特定の目的用に拡張するモジュールを実装する。特に、発話を生成するための機能(発話者毎に話し方のスタイルを変更できる機能)と、広告コピーを生成するための機能(丁寧な表現を生成する機能)などの実現を検討する。

次年度使用額が生じた理由

本年度は、予定していたよりも消耗品費がかからず、また、論文執筆まで研究が進まなかったため、物品費とその他で残額が生じた。次年度では、これらの残額を合わせ、人件費・謝金と物品費を当初計画よりも増額して執行する。

  • 研究成果

    (2件)

すべて 2018

すべて 学会発表 (2件)

  • [学会発表] 述語取り立て形式の整理と文生成器への実装2018

    • 著者名/発表者名
      佐藤理史
    • 学会等名
      言語処理学会第24回年次大会
  • [学会発表] テキストへのキャラクタ性付与のための音変化現象の分類2018

    • 著者名/発表者名
      宮崎千明, 佐藤理史
    • 学会等名
      言語処理学会第24回年次大会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi