2022 Fiscal Year Research-status Report
The development of diagnostic tool for autism spectrum disorder by AI construction
Project/Area Number |
21K18365
|
Research Institution | Aomori Chuo Gakuin University |
Principal Investigator |
加藤 澄 青森中央学院大学, 経営法学部, 教授 (80311504)
|
Co-Investigator(Kenkyū-buntansha) |
斉藤 まなぶ 弘前大学, 保健学研究科, 教授 (40568846)
田中 真寿美 青森中央学院大学, 経営法学部, 准教授 (90557795)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | 自閉症スペクトラム障害 / 自然言語処理 / コーパス言語学 / SFL / 語用論的障害 / 機械学習 |
Outline of Annual Research Achievements |
自閉症スペクトラム障害(Autism Spectrum Disorder:ASD)の主となる症状の1つは、コミュニケーション障害である。このコミュニケーション障害は、語用障害を軸として捉えられ、本研究では、代表加藤の先行研究で構築した「ASD/定型発達+統合失調症の話し言葉コーパス」から、ASD児/者と定型発達児/者の語彙-文法資源の使用の違いを機械学習させ、これら2グループの判別を自動的に行うAIをパイロットスタディとして開発し、臨床の現場で診断ツールとしての適用の可能性を探る。 今年度は、2つの理由からコーパスデータの拡大をはかり、これは今後も継続することになっている。一つは、ASDと定型発達の判別結果への信憑性を高めるために、学習データとなるコーパスの拡大を図るべく、データ収集、トランスクリプト化、アノテーションの一連の工程を継続した。機械学習の対象とする発話の年齢層は、13歳以上、14歳以上、15歳以上の言語獲得臨界期を過ぎた3つの年齢層のグループとした。この年齢層は、受診者数が少なく、受診者の来院を待ちながらのデータ収集となるため、時間がかかる見通しである。 もう一つの理由は、技術的な問題点として、実際の臨床適用のためには、自動アノテーションの精度を上げる必要があることがわかった。それには、機械学習させるデータの容量の拡大をはかる必要がある。本コーパスは、モニター・コーパスとして、拡大、拡大をはかりながら、精度を向上させたが、この工程は、今後も継続する。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
前段階の実験では、特定の2種のディスコース(クライエントの課した課題)に関して、自動アノテーションにおいて90%の精度を達成しているが、今回、その他の課題に対して、自動アノテーションのためのプログラミングを適用したところ、自動アノテーションがなされたのが、30%程度という結果となった。そのため、原因調査を行ったところ、これらの課題に関するデータ数が少ないためという結論に至った。従って、現在、複数の病院でデータ収集を行っているが、対象とする思春期から大人年齢層のケースは、受診者数が少なく、患者の受診を待ちながらのデータ収集となるため、時間がかかる見通しである。また合わせて、PCの限界からくる技術的な問題にも直面している。
|
Strategy for Future Research Activity |
自閉症スペクトラム障害者と定型発達者の言語使用による判別のためのAIの信憑性を高めるために、データ数を可能な限り、増やす必要がある。判別AIは、言語獲得臨界期を過ぎた13歳以上、14歳以上、15歳以上の3つの年齢層のグループを対象とするが、この年齢層は、受診者数が少なく、受診者の来院を待ちながらのデータ収集となるため、時間がかかる見通しである。一方で、臨床への応用のために自動アノテーションの精度向上をはかる必要があり、技術的な問題の解決と、学習データの拡大を図っていく。
|
Causes of Carryover |
自動アノテーションは、前段階の実験では、特定の2種のディスコース(クライエントに課した課題)に関して、90%の正答率を達成しているが、今回、その他の課題に対して、適用したところ、自動アノテーションがなされたのが、約30%となった。原因調査を行ったところ、学習データ数が不足していることがわかった。 また、機械学習の結果の信憑性を高めるために、さらなるデータ収集が必要で、現在、複数の病院でデータ収集を行っている。しかし、対象とする思春期から大人年齢層のケースは、受診者数が少なく、患者の受診を待ちながらのデータ収集となるため、時間がかかる見通しである。こうした事情から、データ収集の人件費・謝金予算に、大幅な未使用金が生じた。これらの未使用金は、次年度、収集データの量に応じて、データ処理、アノテーション作業、プログラミング等の人件費・謝金として使用する予定である。
|
Research Products
(7 results)