• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

Research and Development of a Novel Phonic Diagnostic System with AI Technologies

Research Project

Project/Area Number 18K18407
Research InstitutionTenri Health Care University

Principal Investigator

児嶋 剛  天理医療大学, 医療学部, 特別研究員 (60767698)

Project Period (FY) 2018-04-01 – 2021-03-31
Keywordsディープラーニング / AI / 音声障害 / GRBAS
Outline of Annual Research Achievements

2018年度は初年度であり、ディープラーニングの実験プログラム構成のために高性能GPU・ワークステーションを購入し、TensorFlow (Google, Mountain View, CA, US)、Chainer (Preferred Networks inc. Tokyo, Japan) といった既存のフレームワークを用いてネットワークの設計と学習プログラム作成を行える環境を整備した。以前は市販のデスクトップ PCを用いていたが、ワークステーションにより学習と評価の速度が飛躍的に向上した。
本研究では音声のデータを含んだ診療情報について人工知能(AI)を活用し、熟練した医師のように音声障害の評価や疾患の診断を行うシステムを開発することが目的であるが、まずは音声の評価を行うためにディープラーニングの手法を用い音声障害を聴覚的印象から4段階に分類するGRBAS尺度を人工知能により判定する研究をすすめた。上述のワークステーションにより学習のスピードが向上し、評価・診断支援プログラムを作成し妥当性についても検討できたため論文投稿中である。これは音声障害の評価や疾患の診断を行うシステムを開発する上で基盤となる研究となる。この研究をもとに特に特徴的な音声障害(声帯麻痺・声門上狭窄・痙攣性発声障害など)について、ネットワークの設計と学習プログラム作成を始めている。
その他には各協力研究機関(京都大学医学部附属病院、神戸中央市民病院、倉敷中央病院等の10施設程度予定)において音声および診療データの集約をするために録音音声・録音法の統一を行ないデータの蓄積する準備をおこなった。今後データが増えることでより高性能な学習済みネットワークを作成することが可能となることが期待できる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

1年目として、まず重要であった高性能GPU・ワークステーションを購入およびネットワークの設計と学習プログラム作成を行える環境整備を比較的早くに行えたことで以後の研究も今のところ順調に進展していると言える。以前からすすめていたGRBAS尺度を人工知能により判定する研究についても評価・診断支援プログラムを作成し妥当性についても検討でき、次に行うべき音声障害の評価や疾患の診断を行うシステムを開発する上での下地ができた。
研究を行う上で重要になるのは音声のデータであり、ディープラーニングを行う上では多ければ多いほうが良い。そのため音声および診療データの集約を他施設で蓄積する準備が初年度にできたことは非常に有意義であった。

Strategy for Future Research Activity

今後はデータの集積が一番の課題となるため、初年度に開始したデータ蓄積を更にすすめていく。現状はオフラインでの物理的なデータ受け渡しによるデータ集積をおこなっているが、今後はよりスムースで簡便・安全な方法でデータ集積することをすすめていく。そのためにオンラインでの自動的な音声および診療データ集約システムを設計、実装しデータの蓄積をすすめる予定であるが、そのために個人保護及びセキュリティの問題を解決する必要がある。データ量が増えることで音声障害の程度を年齢や性別などを考慮した同じ条件で比較したり、経時的に治療後の音声を治療前と比べたりすることが可能となることが期待でき、人工知能によって同じ尺度で音声障害を客観的に評価し高い精度での診断支援を可能なシステムを作成することを目指す。

Causes of Carryover

初年度の使用額としてはほぼ想定どおりであったが人件費・謝金として計上していた分を使用しなかったこともあり79,219円が次年度使用額として生じた。2019年度にも学会発表・論文発表が当初の想定以上に予定されており、その経費として使用する予定である。

  • Research Products

    (7 results)

All 2019 2018

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (5 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] Discrimination of "hot potato voice" caused by upper airway obstruction utilizing a support vector machine.2018

    • Author(s)
      3.Fujimura S, Kojima T, Okanoue Y, Shoji K, Inoue M, Hori R.
    • Journal Title

      Laryngoscope

      Volume: 28 Pages: -

    • DOI

      10.1002/lary.27584

    • Peer Reviewed
  • [Journal Article] An innovative voice analyzer ‘VA’ smart phone program for quantitative analysis of voice quality.2018

    • Author(s)
      4.Kojima T, Fujimura S, Hori R, Okanoue Y, Shoji K, Inoue M.
    • Journal Title

      Journal of Voice

      Volume: 22 Pages: -

    • DOI

      10.1016/j.jvoice.2018.01.026.

    • Peer Reviewed
  • [Presentation] Thyroplasty with real-time acoustic analysis.2019

    • Author(s)
      Kojima T, Hori R, Okanoue Y, Fujimura S, Kagoshima H, Atsushi T, Inoue M, Shoji K
    • Organizer
      The 140th Annual Meeting of the American Laryngological Association (ALA) with the Combined Otolaryngological Spring Meetings (COSM)
    • Int'l Joint Research
  • [Presentation] 深層学習による音声障害の病態評価2018

    • Author(s)
      藤村真太郎,児嶋剛
    • Organizer
      第63回日本音声言語医学会総会・学術講演会
  • [Presentation] 当院の音声治療の取り組み2018

    • Author(s)
      田中良,児嶋剛,藤村真太郎
    • Organizer
      第63回日本音声言語医学会総会・学術講演会
  • [Presentation] Discrimination of "hot potato voice" Using Machine Learning with Vocal Tract Model and Articulatory Speech Synthesizer2018

    • Author(s)
      Kojima T, Fujimura S, Hori R, Okanoue Y, Oyagi S, Kagoshima H, Shoji, Inoue M
    • Organizer
      ABEA's 98th Annual Meeting in conjunction with COSM
    • Int'l Joint Research
  • [Presentation] CLASSIFICATION OF VOICE DISORDERS USING DEEP LEARNING MODELS2018

    • Author(s)
      Fujimura S, Kojima T, Hori R, Okanoue Y, Oyagi S, Kagoshima H, Shoji, Inoue M
    • Organizer
      The 139th Annual meeting of the American Laryngological Association in conjunction with COSM
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi