• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Research-status Report

セグメントクラスタリングに基づく未知ドメインデータからの知識獲得法の提案

Research Project

Project/Area Number 17K12718
Research InstitutionWaseda University

Principal Investigator

俵 直弘  早稲田大学, 理工学術院, 講師(任期付き) (50726255)

Project Period (FY) 2017-04-01 – 2019-03-31
Keywords話者適応 / 低資源言語 / 深層学習 / 音響特徴抽出
Outline of Annual Research Achievements

本研究は,系列データから特徴的なパターン(セグメント)を発見し分類する枠組みを構築することで,事前知識が存在しない未知のデータ集合の中からクラス概念を自動的に発見・獲得できる機構の実現を目指す.この目的を実現するため(WP1)セグメント内変動に頑健なセグメント表現(Embedding)法の開発,(WP2)セグメント表現とクラスタリングの同時最適化(Joint Optimization)法の開発,(WP3)再セグメンテーション(Resegmentation)法の開発,(WP4)系列データクラスタリング問題への適用を目指す.平成29年度はそのうち,(WP1)と(WP2)に焦点を当てて研究を行った.
(WP1)では,まず,書き起こしが存在しない低資源言語における音素獲得問題を対象として,未知言語の音響データにおける識別的な特徴抽出法の開発を行った.このとき,音素獲得を行うためには特に話者の違いによる変動が問題となることを明らかにして,複数の既知言語で構築した話者変動抑圧法を未知言語に適用した際の性能を評価した.更に未知言語にも適用可能な新たな話者変動抑圧法として,敵対的学習に基づく話者変動抑圧法を開発した.また,これら技術を開発する中で,音韻性だけでなく話者性も同様の枠組みで抽出できることを明らかにした.
(WP2)では,深層学習を用いてクラスタリングを行う手法の検討を行った.具体的には,可変長のセグメントを固定次元の潜在特徴空間へ射影するネットワークを定義し,潜在表現空間でできるだけコンパクトな表現が得られるようにネットワークを最適化することでクラスタリングを行う方式の適用可能性を検討した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

実施計画においては,平成29年度は(WP1)セグメント内変動に頑健なセグメント表現法の開発と(WP2)セグメント表現とクラスタリングの同時最適化法の開発を目指す計画であった.
(WP1)においては,低資源音素獲得問題を対象とした特徴抽出器の開発を行う中で,話者性と音韻性のように異なる複数の変動成分が含まれるデータを対象としてクラス獲得を行う場合,従来の音素識別器に基づく特徴抽出器ではこれら変動を区別できず意味のないクラスが大量に発生することを明らかにした.同様の問題は一般的な既知ドメインの特徴抽出問題でも生じるが,クラスラベルが利用できない未知ドメインデータではこの問題がより顕著であることが明らかになった.そこで,本年度は特に複数の変動成分を含むデータから特定の変動のみを抽出できる特徴抽出法の開発に注力し,敵対的学習を用いた深層学習を導入することで実現できることを示した.
(WP2)においては,適用を検討した深層学習を用いるクラスタリング手法をそのまま適用した場合(WP1)で示した複数の変動成分の影響が大きくそのままでは適用できないことが明らかになった.しかしながら(WP1)で開発した変動成分を抑える枠組みを併用することでこの問題を回避できる見込みを得た.

このように各項目において研究の変更は発生したが,未知のドメインにおける特徴抽出について課題と解決策の抽出ができたという点で進捗状況は概ね実施計画通りに進展していると言える.

Strategy for Future Research Activity

平成30年度は,引き続き(WP2)セグメント表現とクラスタリングの同時最適化法の開発を行う.特に今年度実現した特定の変動成分を強調する枠組みと統合することで実現を目指す.また,並行して(WP3)クラスタリングとセグメンテーションを同時に行う手法の開発を行い,低資源言語におけるクラス獲得法の開発を継続する予定である.
また,本研究で実現を目指すクラス獲得の枠組みは,音声以外の系列データを対象とすることができる.そこで音声を対象とした場合と並行して,(WP4)として動画像を用いた表情認識問題に本手法を適用することを検討している.具体的には,提案手法で獲得された特徴的な顔画像セグメントを用いることで,顔表情認識コーパス作成のためのラベリング支援ツールを開発する予定である.

Causes of Carryover

旅費については他業務との兼ね合いで参加を予定していた国際学会に参加できなかったためによる.また英語論文についての校正費は今年度末までに投稿準備が完了しなかったため計上しなかった.
更に物品費に関しては当初購入を予定していた計算機よりも高性能な製品が必要となったため,次年度と合わせて使用することにした.
次年度は,計算機設備の拡充のため平成30年度使用額と合わせて高性能計算機およびGPUの購入に充てる.また,研究の進捗に応じ新たなデータコーパスの購入が見込まれるため,その購入費にあてる.

  • Research Products

    (10 results)

All 2018 2017

All Presentation (10 results) (of which Int'l Joint Research: 4 results)

  • [Presentation] Speaker invariant feature extraction for zero-resource languages with adversarial training2018

    • Author(s)
      Taira Tsuchiya, Naohiro Tawara, Tetsunori Kobayashi, Tetsuji Ogawa
    • Organizer
      ICASSP2018
    • Int'l Joint Research
  • [Presentation] 敵対的学習を用いた話者の違いに頑健な特徴抽出とゼロリソース音素識別による評価2018

    • Author(s)
      土屋平,俵直弘,小川哲司,小林哲則
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 話者正規化における言語非依存性とゼロリソース音声認識における効果2018

    • Author(s)
      島田拓也,俵直弘,小川哲司,小林哲則
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 敵対的学習に基づく話者特徴抽出2018

    • Author(s)
      俵直弘,土屋平,小川哲司,小林哲則
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] Exploiting end of sentences and speaker alternations in language modeling for multiparty conversations2017

    • Author(s)
      Hiroto Ashikawa,Naohiro Tawara,Atsunori Ogawa,Tomoharu Iwata,Tetsunori Kobayashi,Tetsuji Ogawa
    • Organizer
      APSIPA2017
    • Int'l Joint Research
  • [Presentation] Language model domain adaptation via recurrent neural network with domain-shared and domain-specific representations2017

    • Author(s)
      Tsuyoshi Morioka, Naohiro Tawara, Tetsuji Ogawa, Atsunori Ogawa, Tomoharu Iwata, Tetsunori Kobayashi
    • Organizer
      ICASSP2018
    • Int'l Joint Research
  • [Presentation] 複数人対話を対象としたRNN言語モデルにおける発話終端情報利用の有効性2017

    • Author(s)
      芦川博人,俵直弘,小川厚徳,岩田具治,小林哲則,小川哲司
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] Word Vector Augmentation by its Definition for Zero-shot Image Classification2017

    • Author(s)
      Kotaro Kikuchi, Naohiro Tawara, Tatsunori Kobayashi, Yoshihiko Hayashi
    • Organizer
      CVPR Language and Vision workshop
    • Int'l Joint Research
  • [Presentation] ドメイン依存・非依存の内部表現を有する再帰型ニューラルネットワーク言語モデル2017

    • Author(s)
      森岡幹,俵直弘,小川哲司,小川厚徳,岩田具治,小林哲則
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 辞書定義文を用いたゼロショット一般物体認識2017

    • Author(s)
      菊池康太郎,俵直弘,小林哲則
    • Organizer
      画像の認識・理解シンポジウム(MIRU)

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi