2020 Fiscal Year Research-status Report
Building a Data Knowledge Circulation System for Psychotherapy Using Artificial Intelligence Technology
Project/Area Number |
20K20876
|
Research Institution | National Center of Neurology and Psychiatry |
Principal Investigator |
伊藤 正哉 国立研究開発法人国立精神・神経医療研究センター, 認知行動療法センター, 室長 (20510382)
|
Project Period (FY) |
2020-07-30 – 2022-03-31
|
Keywords | 人工知能 / 機械学習 / 心理療法 / マルチモーダル / 自然言語 / センシング / 構造化知識 |
Outline of Annual Research Achievements |
本研究が想定する最終目標は、データ駆動型とエキスパート型の人工知能技術を組み合わせることで、心理療法内外のあらゆる“意味のある”情報をセンシングし、ビッグデータを取得し、解析可能とするデータ知識循環を実現することにある。本年度は、認知行動療法の構造化知識の構築を推し進めた。具体的には、UPに含まれる8つのモジュールの全てについての構造化知識の第1版を作成し、精緻化を進めた。構造化知識の各ロールにリンク可能なセンシングデータについては、アイトラッキングやセッション映像の多視点同時撮影システムの検討を進めた。マルチモーダルなセンシングが可能となるように、当該研究施設に認知行動療法ラボを設置した。加えて、臨床試験で得られた録音データのトランスクリプト化を進めた。トランスクリプトは、認知行動療法を実践する複数の臨床心理士によってすべての発話について検討され、プロトコルの内容に照らし合わせて有意味な発話を拾い出し、ラベルづけを行った。これは治療文脈に沿ったする発話(例:発話「恐怖は逃げろというメッセージを出しているんです」ラベル「感情の機能・警報」)、無関係な発話(例:発話「特にありません」ラベル「その他」)を振り分けることで、機械学習の効率向上を意図している。並行してデモンストレーションビデオのトランスクリプトを用いて、自然言語処理の各解析手法の有効性の検討を進めた。MeCabやGiNZA による形態素解析結果の比較を行ったのち、自然言語を機械学習モデルに入力するためにone-hot 表現、Fasttext、Term Frequency- Inverse Document Frequencyを用いた単語及び文章のベクトル変換の有効性について検討した。加えて、現状では解析データ量が少ないため、ルールベースのアプローチの検討と、EDA及びDTによるデータ拡張手法の有効性の検討を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初計画では、マルチモーダルなセンシング手法をより具体的に進めて、試験的にデータ取得までを目指していた。また、機械学習にかけるための臨床試験の録音データのトランスクリプトやアノテーションの推進を目指していた。しかしながら、新型コロナウイルス感染症の拡大による緊急事態宣言によって、当センターに設置予定のマルチセンシングルーム(認知行動療法ラボ)の工事が遅れたとともに、在宅勤務によって個人情報を含む心理療法のトランスクリプト化が停滞した。とはいえ、上記のように現状で活用できるデータを用いて構造化知識の構築や、最適な自然言語処理の検討を進めることができた。
|
Strategy for Future Research Activity |
出勤して作業するのと同等のセキュリティを確保するために以下2つを検討する予定である。 1.当センター内に設置されたネットワーク接続ストレージ(NAS)に専用PCでVPNアクセスする。当センターのNASは他部署からは存在が見えず、当センターにおいても現在登録された者が許可された場所しかアクセスできない形になっている。特定の場所に置かれたデータは音声や動画であればプレイヤーを通してのみ再生可能とする。 2.Dropbox businessを活用する。Dropbox社によればすでに15万社に導入されており、データ漏洩防止には十分な実績があり、セキュリティ全般も継続的に向上していると考えられる。保存したデータは登録者のみに共有しダウンロード不許可の設定をすることでread onlyなアクセスが可能になると考えられる。
|
Causes of Carryover |
新型コロナウイルス感染症の感染拡大による緊急事態宣言の影響により、当センターに設置予定であったマルチセンシングルーム(認知行動療法ラボ)の整備が遅延した。これにより、マルチモーダルなセンシングによるデータ取得の手法の検討が進められなかった。また、在宅勤務により、個人情報を含むデータを用いたトランスクリプト化やアノテーションの作業が大幅に遅れた。これらに対応するため、セキュアなクラウド環境での作業など、在宅勤務においても推進できるデータ処理環境の整備を進めたい。また、ビッグデータを想定した機械学習の手法のみではなく、ルールベースの解析手法についても検討を進める。これらのデータ解析に関連する工夫に加えて、ラボの設置の遅延によるマルチセンシングルームを活用したデータ取得に関しても、専門の業者や、新たな共同研究者との検討を進める。
|