Project/Area Number |
23K11344
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62020:Web informatics and service informatics-related
|
Research Institution | Sendai National College of Technology |
Principal Investigator |
力武 克彰 仙台高等専門学校, 総合工学科, 准教授 (50515145)
|
Co-Investigator(Kenkyū-buntansha) |
高橋 晶子 仙台高等専門学校, 総合工学科, 准教授 (10537492)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2026: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2025: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
|
Keywords | 自然言語処理 / 伝統医学 / 証 / BERT |
Outline of Research at the Start |
伝統医学では、患者の心身の総合的な状態を反映する「証」を特定し、その「証」に基づいた治療を行うことが特徴である。「証」にはある証が別の証の原因となるといった因果関係が存在し、伝統医学の診断においては「証」間の因果関係を的確に把握しておくことが、個々の患者の状況に合わせた治療につながる。 本研究では自然言語処理技術を活用し、「証」について記載された伝統医学の文献テキストから「証」間の因果関係を推定する機構を構築する。これらの「証」の情報を蓄積したデータベースを構築し、伝統医学の診断を支援するシステムの実現につなげる。
|
Outline of Annual Research Achievements |
伝統医学において「証」は患者の心身の病態を表す重要な概念であり、医師の診察により特定される。証の診断には、複数の症状と証同士の因果関係を適切に結び付ける必要があり、多くの診療経験と知識が要求される。これにより、診療経験の少ない医師を支援する仕組みが必要とされる。医療現場で伝統医学を活用するためには、伝統医学の知識を提供し、「証」の診断や治療方針の決定を支援するシステムが求められている。本研究では、「証」を中心とした伝統医学の診断支援システムを、伝統医学文献のテキストに対する自然言語処理技術を活用して構築することを目指している。 今年度は、伝統医学文献に対する自然言語処理技術の開発を主に行った。伝統医学文献には、文献ごとの表記の揺れや特有の語彙が存在し、一般的な自然言語処理技術では十分な性能を発揮できない。そこで、我々は翻訳や文書分類、検索などのタスクに広く適用できるBERT(Bidirectional Encoder Representations from Transformers)モデルを基盤とし、伝統医学文献に対応できるBERTモデルの構築に取り組んだ。日本語テキストに対応した事前学習済みのBERTモデルに対し、証や症状などの伝統医学に特化した語彙を追加し、文献から作成した文章の分類タスクによる追加学習(ファインチューニング)を行った結果、伝統医学文献に対応したBERTモデルを作成した。検索性能の評価では、表記の揺れを解消しつつ、TF-IDFと同等以上の性能を確認できた。 さらに、本研究で構築したBERTモデルを活用し、証の検索システムの設計とプロトタイプの構築を行った。これにより、証に関する高度な検索手法を容易に行えるようになり、伝統医学に基づく診断の支援に繋がることが期待される。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の実施計画では、マイルストーンとして(1)「証」データベースの構築、(2)「証」間の因果関係の推定手法の確立、(3)「証」を中心とした伝統医学の診断支援システムの実現、を設定している。 (1)および(2)の実現に向けては、伝統医学文献に記載された「証」に関する記述を含むテキストデータから情報を抽出する系列ラベリングや、テキスト間の比較・分析によるテキスト含意認識など、各種タスクを実行できる自然言語処理技術が必要とされる。 本年度では、これらの汎用的なタスクを行うことができるBERTモデルを作成し、検索タスクに関して、従来の手法に対して同等以上の性能を確認できた。これにより、本年度に作成したBERTモデルを基盤とし、各種タスクに最適なモデルを構築することで、(1) および (2) の実現に向けた基盤を整えることができたといえる。 また、(3) に関しては「証」の検索システムのプロトタイプの構築を行った。上記のBERTモデルを実際に組み込んだシステムを構築し、モデルの実用性と、診断支援システムの実現可能性を示すことができた。
|
Strategy for Future Research Activity |
本年度は伝統医学文献のテキスト処理に向いた自然言語処理技術の基盤となるBERTモデルを作成し、検索タスクに関してその有用性を確認することができた。 今後はまず、本BERTモデルを系列ラベリングや文書分類などの他の自然言語処理タスクに適用できるよう拡張および応用を進める。これにより、伝統医学文献テキストから証の診断に必要となる、証名や症状、治療法、生薬などの固有表現の抽出が可能となると考えられるため、(1)「証」データベースの構築につなげる。さらに、(2)「証」間の因果関係の推定手法の確立に向け、テキスト含意認識タスクへの拡張を行い、文献テキストから因果関係抽出に取り組む。 本年度構築した「証」の検索システムのプロトタイプに関しては、伝統医学専門医の協力のもと、検索の性能やシステムの使用性の検証を実施しそのフィードバックを得ることで、実際の医療現場において活用できる(3)「証」を中心とした伝統医学の診断支援システムの実現に取り組む。 なお、近年急速に研究が進む大規模言語モデル(LLM)は本研究課題と親和性が高いと考えられる。大規模言語モデルに関して伝統医学分野への適用可能性の調査を行い、本課題遂行に必要となる自然言語処理技術の確立や、診断支援システムの構築についても新たな研究課題として視野に入れる。
|