Statistical Methods for Human Glycome Data Analysis
Project/Area Number |
23K11021
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Doshisha University |
Principal Investigator |
宿久 洋 同志社大学, 文化情報学部, 教授 (50244223)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2024: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 遺伝子発現データ / グライコーム / 変分オートエンコーダー / データ変換 / Human Glycome / Complex data |
Outline of Research at the Start |
本研究では,ヒトの細胞から得られた遺伝子に関して分子レベルのデータであるヒューマングライコームデータの分析法に関する基礎的な研究を行う.同データは,これまで扱われてきたゲノムデータに比べ,より細かい分子構造の単位で構成されており,最も疾病に関連する情報を保持していると言われている.そのため,原因が未解明の疾病治療への利用が期待されている.しかしながら,同データについては,分析上の問題点を多く含んでいる.そのため,通常の多変量解析の手法を用いて分析することは困難である.そこで本研究では,ヒューマングライコームデータへの適用を目的とした新たな解析法の開発を行う.
|
Outline of Annual Research Achievements |
本研究では,ヒトの細胞から得られた遺伝子に関して分子レベルのデータであるヒューマングライコームデータの分析法に関する基礎的な研究を行う.このデータは,これまで扱われてきたデータに比べ,より細かい分子構造の単位で構成されている.そのため,最も疾病に関連する情報を保持していると言われている.このような情報を保持していることから,原因が未解明の疾病治療への利用が期待されている.しかしながら,同データについては,分析上の問題点を多く含んでいる.そのため,通常の多変量解析の手法を用いて分析することは困難である.そこで本研究では,ヒューマングライコームデータへの適用を目的とした新たな解析法の開発を行う. 本年度は,グライコームデータとゲノムデータに関して共通と考えられる問題を解決するため,ゲノムデータに着目した分析方法の研究を行った.具体的には,得られているデータに対して変換を行ったのち既存の方法を適用する分析方法に関する検討を行った.特に遺伝子に関する情報はカウントデータであるため,データを変換したのちに既存の方法を適用することを検討した.これに加えて,データを構成する他のオミクス情報を利用した方法,ラベルの情報を利用した方法の開発に取り組んでいる.本研究で取り扱っている方法に対して,細胞の分類に関する分析,また,細胞分化の時間発展に関する分析に対して,実際の遺伝子発現データを用いた実験を行った.この結果,合理的と考えられる実験の結果を得ることができた.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初の研究計画では,グライコームデータに関する分析方法の開発に取り組む予定であった.しかし,グライコームデータとゲノムデータ,共通の問題が見つかったため,ゲノムデータに関するいくつかの問題へ取り組むことを優先して行った.そのため,当初計画していた解析手法の開発が遅れている.
|
Strategy for Future Research Activity |
これまでの研究を通して,2つの問題が明らかとなった.1つ目の問題は既存の細胞・遺伝子の分類法についての問題である. 2つ目の問題としては,細胞を低次元空間に埋め込む際のノイズの問題である.これら2つの問題には,モデルとしての問題に加え,計算速度として推定が非現実的であるという問題も含まれている.これらの問題は,ゲノムデータでもしばしば発生する問題であり,2024年度については,この2つの問題の解決を中心に取り組む予定である.具体的な方法としては,変分オートエンコーダを用いることにより,これらの解決を試みる.これらの方法に関する問題に対して,ある程度の見込みがたったのちに,より複雑なデータの分析法の開発を進める予定である.
|
Report
(1 results)
Research Products
(5 results)