2022 Fiscal Year Research-status Report
Development of cell lineage inference method from cell atlas based on information criteria
Project/Area Number |
21K19827
|
Research Institution | Osaka University |
Principal Investigator |
松田 秀雄 大阪大学, 大学院情報科学研究科, 教授 (50183950)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | RNAシーケンシングデータ解析 / 遺伝子発現プロファイル解析 / 細胞系譜推定 / 細胞アトラス / バイオインフォマティクス |
Outline of Annual Research Achievements |
本研究では、多様な細胞集団に対して1細胞RNAシーケンシングをすることで得られる遺伝子発現データを基に、細胞集団の持つ多様性と連続的な状態遷移過程についての知見を得ることを目的としている。 具体的には、刺激応答等に対する細胞内の遺伝子発現プロファイルの比較や、二光子励起顕微鏡で観察した細胞動態の変化などの情報を利用して、細胞の状態遷移過程を推定する手法の開発を実施している。実際に、疾患と健常状態等の2群の1細胞RNAシーケンシングデータから、ある群に特異的な細胞間コミュニケーションを検出する手法を開発した。また、がん由来の培養細胞株から取得したRNAシーケンシングデータから複数の遺伝子が融合した融合遺伝子配列の検出手法を開発した。さらに、種々の炎症刺激に対するマウス好中球を二光子励起顕微鏡で経時的に観察した動画像において細胞を追跡する手法を開発した。 現在、マウス胚性幹細胞(ES細胞)に対して分化誘導をかけたときの1細胞RNAシーケンシングデータに対して細胞系譜を推定し、細胞系譜に沿って細胞を整列させた遺伝子発現プロファイルを、疑似的な時系列発現プロファイルとみなして、深層学習により遺伝子制御ネットワークを推定する手法の開発を行っている。これにより、複数の細胞種に分化する細胞集団に対して、それぞれの細胞分化の系譜ごとに分化を制御している遺伝子制御ネットワークを推定することで、細胞分化を制御しているメカニズムについての知見を得ることを目指している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
開発した2群の1細胞RNAシーケンシングデータから一方の群に特異的な細胞間コミュニケーションの検出手法を使って、T細胞でのサルコイドーシスに特異的な細胞間コミュニケーションパスウェイを検出することができた。また、開発した融合遺伝子配列の検出手法を利用して、乳がんの培養細胞株のRNAシーケンシングデータから、従来の融合遺伝子配列検出手法よりも高い精度で融合遺伝子を検出する手法を開発した。さらに、経時観察画像での細胞追跡手法を、種々の炎症刺激を与えたときのマウス好中球の二光子励起顕微鏡で観察した動画像に適用したところ、LPSやGMCSFなどの刺激ごとに特徴的な細胞遊走のパターンを検出することができた。 さらに、研究協力者である、奈良県立医大 堀江教授のグループから、マウス胚性幹細胞(ES細胞)の変異体バンクから、2種類の変異体と野生型に対して分化誘導をかけたときの分化前、分化後7日目および14日目の1細胞RNAシーケンスデータの提供を受け細胞系譜の推定を行った。その結果、2種類の変異体および野生型において、相互に異なる3種類の細胞系譜が得られた。現在、これらの細胞系譜ごとに遺伝子制御ネットワークを推定することで、変異体と野生型での細胞分化の状態遷移過程の違いを解析している。 以上のことから、本研究はおおむね順調に進捗していると考えられる。
|
Strategy for Future Research Activity |
細胞系譜および遺伝子制御ネットワークの推定手法の中核部分である深層学習に基づく機械学習手法の改良を優先して進めていく。深層学習に基づく機械学習手法は大きな進展をしており、本研究で重要となる時系列に沿った状態遷移過程に対応した深層学習モデルがいくつか提案されているため、それらを実装した手法の開発を行う。特に、遺伝子制御ネットワークの推定では、転写因子とその標的である遺伝子の間の制御関係の検出が必要となる。このための教師データとしては、TRRUST等のデータベースを利用する。また、機械学習のモデルとしては、当面は時系列データの深層学習に適したLong Short Term Memory(LSTM)を改良したモデルをベースに開発を進め、さらに近年進展が著しいTransformerに基づくモデルの開発を検討する。教師データとなる遺伝子制御関係の情報は既存のデータベースに登録されているだけでは少ないため、独自に文献等をあたってデータを増やすとともに、ベイジアンネットワークモデル等を使った遺伝子発現プロファイルからの既存の遺伝子制御関係の推定結果等を基にしたデータ拡張なども検討する。 以上の推定手法を、細胞集団の状態遷移過程での1細胞遺伝子発現プロファイルに適用することで、細胞集団ごとの状態の多様性や、状態遷移過程で機能する遺伝子制御のメカニズムについての知見を得ることを目指す。
|
Causes of Carryover |
本研究での細胞集団の状態遷移過程の推定では、機械学習の教師データとして細胞アノテーション(細胞種のラベル)が付与された1細胞RNAシーケンシングデータが必要であるが、公開されているデータをデータベースや論文等で調査したところ、データの量やアノテーションの質ともに十分ではないことが判明した。そこで、今年度は、既知の細胞種についての状態遷移過程の推定手法の開発を重点的に行い、今年度に予定していた汎用的な細胞集団間の状態遷移過程の推定手法の開発の一部を次年度に実施するように研究計画を修正した。このため、今年度に予定していた研究成果発表が次年度に繰り越しとなり、次年度の使用額が生じた。 一方で、研究協力者から提供を受けたマウスES細胞の変異体に分化誘導をかけたときの1細胞シーケンシングデータを解析した結果、細胞系譜についての新たな知見が得られ、本研究での推定手法の開発で重要な手掛かりとなった。 以上のことから、状態遷移過程の推定手法の開発では当初想定されていなかった課題が生じたが、一方で細胞系譜推定手法の開発では、手法の有効性と意義が明確となり、次年度に予定していた手法の応用と評価の一部を前倒しで行うことができたため、本研究全体の進捗への影響はないと考える。
|
Research Products
(4 results)