自閉症や統合失調症には共通して支離滅裂な発話等の思考障害が確認される。この思考障害傾向の評価はこれまで医療従事者のチェックシートに沿った主観に基づいて行われてきたため、定量的な計測と患者間の比較に限界があった。そこで本研究では定量評価手法の確立を目指して新たに思考障害ラベル付きの音声発話データセットを収集し、定量評価可能な言語特徴量と思考障害傾向との関係性について特性分析を行った。 音声データセット収集では健常者を対象とし、各データにはSchizotypal Personality Questionnaireを思考障害傾向ラベルとして付与した。発話時間とテーマの影響も調べるため、「30秒」「60秒」「180秒」の3条件、「一番大きな失敗」「ネガティブな記憶」「最近見た夢または好きなこと」の3条件、それらを組み合わせて合計9条件のデータ収集を行い、自動特徴量による思考障害傾向の定量評価を試みた。また、関連研究領域の発展に資するためにデータセットの公開も行った。本研究ではクラウドソーシングによる匿名化済みのデータを収集・公開することでプライバシー保護とデータの自由利用を両立させ、同一データセットに対して先行研究の特徴量を同時に算出することで思考障害傾向との関連性について比較検討を世界に先駆けて実現した。 機械学習モデルによる傾向スコア推定性能を比較したところ、ネガティブな記憶が思考障害傾向の発話への表出を最も誘発していることが示唆された。発話長が与える影響については、長くなれば長くなるほど思考障害傾向を誘発していることが示された。さらに特徴量ごとの有効性を比較するために行ったアブレーションの結果、概略的言語特徴と時間的言語特徴が思考障害傾向推定において重要であることが確認された。
|