| Project/Area Number |
24K22341
|
| Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
| Allocation Type | Multi-year Fund |
| Review Section |
Medium-sized Section 62:Applied informatics and related fields
|
| Research Institution | Nara Medical University |
Principal Investigator |
西岡 祐一 奈良県立医科大学, 医学部, 助教 (50812351)
|
| Co-Investigator(Kenkyū-buntansha) |
藤本 圭男 奈良県立医科大学, 医学部, 教授 (90192731)
|
| Project Period (FY) |
2024-06-28 – 2026-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Fiscal Year 2025: ¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Fiscal Year 2024: ¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
|
| Keywords | グレブナー基底 / Claims Database / 医学統計学 / ビッグデータ / リアルワールド / 交絡因子 / Grobner basis / レセプト / 交絡 |
| Outline of Research at the Start |
本研究は、レセプトの膨大な情報を有効に活用するため、純粋数学のグレブナー基底(多変数多項式の割り算による簡約化を一意に行うことができる多項式の集合)の考え方を医学統計学に応用する試みである。本研究の挑戦が実を結べば、A.医薬品・傷病名・診療行為・特定器材間の新たな関連性が見出される。集積されたレセプト情報から新たな研究仮説が次々に生まれれば、医学系研究のブレークスルーに繋がる。さらに、B.イデアル所属問題に置き換えることで交絡関係を具体的に示すことができる。最後に本研究は、C.蓄積されたデータから未知の関連性、研究仮説を見出す手法として広く情報学分野の発展に貢献し得る。
|
| Outline of Annual Research Achievements |
本研究の目的は、保険請求における診療報酬請求明細書(レセプト)などの大規模データから新しい研究仮説や定量化された交絡関係を見出す統計手法を開発することである。レセプト(Administrative Claims Database)を用いた臨床疫学研究が国内外で急増している。レセプトには日々の診療について多くの情報が含まれているが、データが大規模かつ複雑で取り扱いが難しいため研究での活用は限定的である。網羅的解析や探索的研究の試みは機械学習を利用したものを含め存在する。しかし、レセプトから得られる多変数が複雑に絡み合った関係式を解釈するのは困難であり、既存研究では研究仮説を生み出すことに成功しているとは言えない。 本研究は、レセプトの膨大な情報を有効に活用するために、純粋数学のグレブナー基底(多変数多項式の割り算による簡約化を一意に行うことができる多項式の集合)の考え方を医学統計学に応用する初の試みである。本研究の挑戦が実を結べば、次のA~Cの成果が期待できる。 まず、A.医薬品・傷病名・診療行為・特定器材間の新たな関連性が見出される。集積されたレセプト情報から新たな研究仮説が次々に生まれれば、医学系研究のブレークスルーに繋がる。研究が予定通り進捗しない場合も、B.交絡関係を定量的に示すことができる。グレブナー基底の導入により、交絡関係はイデアル所属問題に置き換えられる。既知の実験計画法の考え方を用いることで、交絡因子の寄与を定式化して評価できるようになる。最後に本研究は、C.レセプト研究のみならず、蓄積されたデータから未知の関連性、研究仮説を見出す手法として広く情報学分野の発展に貢献し得るものである。 2024年度はグレブナー基底を用いて線形結合モデルにおける交絡関係の一般化のための統計手法を開発した。本成果は現在論文投稿中である。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
レセプトを用いた疫学研究は、大規模かつ選択バイアスの少ないリアルワールドデータが得られることから、近年その重要性が世界的に認知され、日本でも推進されつつある。 蓄積された膨大なレセプト情報から医薬品・傷病名・診療行為・特定器材・予後といった各変数間の新たな関連性を見出せるのではないかという着想は以前からあるが、成功した事例はほとんどない。その大きな原因として変数が極めて多く関係式が複雑であることと交絡因子の問題の2点がある。研究代表者は大規模なレセプト研究を実施できる限られた研究チームの一員であり、研究分担者とともにこれらの課題を克服する新たな応用統計手法について研究してきた。中でも、グレブナー基底のアルゴリズムはブール環を用いることで小さな次数で扱えること、ブール環自体は集合演算の表現に適しておりレセプトなどの電子データと相性が良いことから、グレブナー基底を用いた新たな統計手法開発を着想した。すなわち、本研究は、膨大な情報を有効に活用するために、純粋数学のグレブナー基底の考え方を医学統計学に応用する全く新しい試みである。申請者が目指す新たな統計手法は、レセプト研究の課題を克服し、医学系研究・情報学系研究のブレークスルーに繋がる可能性を秘める。 2024年度には実際に統計手法の開発に成功し、成果については現在論文投稿中である。
目標としてきた統計手法の開発に成功したことから、おおむね順調に進展していると考えている。本研究は情報学におけるグレブナー基底の最も有用な応用例なるほか、レセプト研究のみならず、蓄積されたデータから未知の関連性、研究仮説を見出す手法として広く情報学分野の発展に貢献し得るものである。
|
| Strategy for Future Research Activity |
これまでグレブナー基底の理論は、国内外においてマルコフ基底を用いた正確検定や条件付き独立性に関する研究、実験計画法等の計算代数統計(computational algebraic statistics)に応用されてきた。しかしながら、現状ではこれらの応用手法を使える状況は限定的と言わざるを得ない。その要因として最も大きいのは、グレブナー基底を求める過程を(現実的には)一般化しづらいことである。理論的にはどんな多変数多項式の集合もBuchberger's Algorithmを用いることで等価(同じイデアルを生成)なグレブナー基底に変換することは可能である。しかしながら、実務的に現実的な時間内で変換作業が終わる保証はなく、実際にごく簡単な多変数多項式の集合でさえグレブナー基底を求めると膨大な多変数多項式の集合に変換されることも稀ではない。用いるコンピュータの性能にも解析にかけられる時間にも当然限界がある。いったん求めれば性質の良い多変数多項式の集合であるグレブナー基底も、求めるまでの過程が常に(実務的に)完結するとは限らないという大きな限界を抱えているのである。研究代表者はこの大きな限界に対して、有限体F_2上でのグレブナー基底であるブーリアングレブナー基底を導入した。これにより次数の問題を解決し、ある種無限を有限に変えるというのが本研究の発想であり、計算負荷を大きく減らすことができている。 今後、開発した統計手法を用いて傷病名、医薬品、診療行為、特定器材、予後に関する情報から、関連を定式化する。得られた関係式の有限体F_2上のグレブナー基底であるブーリアングレブナー基底を求めることで、より簡単な関係式の集合を得る。得られた式を解釈し、数学的、疫学的、臨床的妥当性を吟味することを繰り返し、簡約化された式の中から医学的に重要な知見を得る新たな方法論の確立とエビデンスの創出を目指す。
|