• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

語順整序との同時実行に基づく読みにくい文の整形処理

Research Project

Project/Area Number 19K12127
Research InstitutionTokyo Denki University

Principal Investigator

大野 誠寛  東京電機大学, 未来科学部, 教授 (20402472)

Project Period (FY) 2019-04-01 – 2025-03-31
Keywords言語生成 / 整形処理 / 言い換え / 構文解析 / 係り受け解析 / 話し言葉処理 / 読点挿入 / 語順整序
Outline of Annual Research Achievements

本研究では、議事録や科学技術論文、製品マニュアル、ビジネスメール等における作文支援技術として、話し言葉や即興で生成された書き言葉に頻出する読みにくい文を読みやすく整形する手法を開発する。令和5年度は以下の4項目を実施した。
(1)Shift-Reduce法に基づいて係り受け解析・語順整序・読点挿入を同時実行する手法の開発を推進した。具体的には、各時点の操作選択においてBERTを用いた分類モデルを導入するとともに、処理途中で非文が生成されることを回避すべく、従来の拡張Shift-Reduceアルゴリズムにおいて、同じ文節に係る2文節間でのみ語順入替を許すように変更することにより、精度向上を図った。
(2)話し言葉を読みやすい字幕に整形するための要素技術として、漸進的係り受け解析と残存文長推定に基づく逐次的な改行挿入手法の開発を行った。文節が入力されるごとに、改行挿入判定と残存文長推定をBERTを用いて同時実行し、その際の改行挿入判定において、漸進的係り受け解析から得られる構文情報を用いることにより,逐次的な改行挿入における精度向上を図った。
(3)読みやすい位置での逐次的な改行挿入等への応用を目的に、漸進的係り受け解析技術の開発を推進した。具体的には、話し手の発話の予測手法の開発に取り組むとともに、発話の予測を考慮しつつ漸進的係り受け解析を行う手法の開発に取り組んだ。
(4)読みやすい文への整形を実現するための基盤技術として、各文節における適切な助詞列を推定する手法の開発に取り組んだ。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

研究実施計画に従って、従来の語順整序手法にBERTを組み込んだ手法の開発を推進し、一定の成果を得ることができた。また、読点挿入・語順整序・係り受け解析を同時実行するアルゴリズムの開発に前倒して取り組み、2種類のアルゴリズムの考案と実装及び評価実験まで実施した。助詞換言手法を検討するため、各文節における適切な助詞列を推定する手法の開発を推進した。これら各手法に対する詳細な評価や考察がやや遅れている。
その他、本研究課題の関連研究として、BERTを用いた日本語講演テキストへの改行挿入手法や、残存文長の推定手法の開発、漸進的係り受け解析に関する研究、残存文長と漸進的係り受け解析結果を考慮した逐次的改行挿入手法の開発を推進した。さらに、読みにくい文の一つである平仮名文に対して、高精度かつ実用的な速度で解析可能な形態素解析器を開発した。
なお、研究実施計画では、話し言葉や即興で生成した書き言葉と、それらを人手で読みやすく整形した文のペアの収集を予定していたが、検討の結果、それらの収集は行わず、前述の各種手法の開発を優先して実施している。

Strategy for Future Research Activity

引き続き、ニューラル言語モデルを用いて読点挿入・語順整序・係り受け解析を同時実行する手法の開発を推進し、これら各手法の詳細な評価や考察を進める予定である。また、ニューラル言語モデルを用いた助詞推定に関する研究を推進する予定である。
その他、本研究課題の関連研究として、引き続き、ニューラル言語モデルを用いた日本語講演テキストへの改行挿入手法や漸進的係り受け解析に関する研究を推進する予定である。

Causes of Carryover

理由:研究実施計画では、話し言葉や即興で生成した書き言葉と、それらを人手で読みやすく整形した文のペアの収集を予定していたが、検討の結果、それらの収集を行わず、各種手法の開発を優先して実施したため。また、研究期間中のコロナ禍のため、予定していた各種学会発表のいくつかがオンライン開催となったため。
使用計画:成果発表等に使用する予定である。

  • Research Products

    (5 results)

All 2024 Other

All Presentation (4 results) Remarks (1 results)

  • [Presentation] 処理途中での非文生成の回避を考慮した係り受け解析・語順整序・読点挿入の同時実行2024

    • Author(s)
      荒木 駿介, 大野 誠寛, 松原 茂樹
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 漸進的係り受け解析と残存文長推定に基づく講演文への逐次的な改行挿入2024

    • Author(s)
      高橋 晨成, 大野 誠寛, 松原 茂樹
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 語りの傾聴における補完応答の生成のための話し手の発話の予測2024

    • Author(s)
      海野 博揮, 大野 誠寛, 伊藤 滉一朗, 松原 茂樹
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] Shift-Reduce法に基づく未入力トークン予測と漸進的係り受け解析の同時実行2024

    • Author(s)
      橋本 優希, 大野 誠寛, 松原 茂樹
    • Organizer
      言語処理学会第30回年次大会
  • [Remarks] 語順整序との同時実行に基づく読みにくい文の整形処理

    • URL

      https://www.cll.im.dendai.ac.jp/~ohno/kaken/revision-word-reordering/index.html

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi