Development of wearable device for speech restoration due to laryngeal cancer.
Project/Area Number |
22KJ0795
|
Project/Area Number (Other) |
22J11210 (2022)
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Multi-year Fund (2023) Single-year Grants (2022) |
Section | 国内 |
Review Section |
Basic Section 90150:Medical assistive technology-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
竹内 雅樹 東京大学, 工学系研究科, 特別研究員(DC2)
|
Project Period (FY) |
2023-03-08 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥1,700,000 (Direct Cost: ¥1,700,000)
Fiscal Year 2023: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2022: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | 機械学習 / 電気式人工喉頭 / ニューラルネットワーク / 振動子 / 振動音 |
Outline of Research at the Start |
喉頭がんなどの病気により失われた声を取り戻せるウェアラブルデバイスを開発します。従来から存在するEL(電気式人工喉頭)という円筒型のデバイスは発声時に片手が塞がり、ロボットのような無機質で機械的な音声しか出せず、日本で市販されてから20年以上デバイスの見た目が変わっていないという問題があり、患者さんは悪目立ちしたくないことから、使用を避けてきました。そこで我々はハンズフリーで発声時に両手が使えて、かつヒトに近い声を発声でき、日常生活で使用しても悪目立ちしないデバイスを開発します。本研究では、よりヒトの声に近づけられるように振動音の改良を目指します。
|
Outline of Annual Research Achievements |
昨年、研究実施計画を変更し、振動子を複数配置する・フィードバックをかけて抑揚制御を行うことにすることから、振動音の作成方法をLPC残差波を用いた方法でなく、ニューラルネットワークモデルを用いて機械学習を行い作成する、という方針に変更してから1年間ニューラルネットワークモデルの設計に尽力した。独自の録音システムを作成しそこで機械学習用の入力および教師データを収集したことで、声を失った方の録音データが従来だと2時間弱時間かかるところを5秒間の日本語母音「あ」の発声だけでその人の声に近づくように設計をした。また声を失った方でも簡単に使用できるようにシンプルなニューラルネットワークのモデルの構築を心掛けて、中間層を1つ入れただけの非線形モデルにより、従来の振動音よりも高周波数帯において人間の自然発話に近くなるという結果を得ることができた。この結果を持って、生体医工学会大会に採択され、IEEE EMBCにはOne page paperを提出した。また曲げセンサを用いて首を曲げるだけでハンズフリーで振動音のON/OFFを制御できる機構は昨年度中に作成していたが、そこから改良を加えて、乾電池をリチウムイオンポリマー電池から単4にして安全性の向上に努めたり、振動子を1つにすることで高音域のノイズを減らしたりした。まだ実用化に向けてのハードルは数多く存在するので、科研費の期間が終了後も引き続き改良を重ねて、声を失った方に届けられるようにしたいと考えている。
|
Report
(2 results)
Research Products
(13 results)