2019 Fiscal Year Research-status Report
非負値テンソル分解を用いたオーファン受容体結合リガンドの同定及び機能解明
Project/Area Number |
19K20406
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
露崎 弘毅 国立研究開発法人理化学研究所, 生命機能科学研究センター, 特別研究員 (70769520)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | バイオインフォマティクス / 1細胞RNA-Seq / 情報検索 / 機械学習 / オミックス / 次元圧縮 / テンソル分解 / 逆薬理学 |
Outline of Annual Research Achievements |
Gタンパク質共役型受容体(GPCR)は、既存薬の多くが関与する、重要な創薬ターゲットであるが、リガンド未知のオーファン受容体が多く存在することから、オーファン受容体のリガンド特定(脱オーファン化)が求められている。本研究では、1細胞RNA-Seqデータに含まれる細胞間相互作用(Cell-Cell Interaction: CCI)を網羅的に検出し、CCIに特異的に共発現するオーファン受容体とリガンドのペアを特定することで、オーファン受容体に結合するリガンド、及びそれらの結合が関与する細胞機能を同時に推定する。本研究で得られる、オーファン受容体-リガンド-細胞機能の三項関係は、新規創薬ターゲットとして期待される。 既存の脱オーファン化研究としては、オーファン受容体を強制発現させたセルラインによるアッセイ系や、タンパク質や化合物の構造情報を利用したバーチャルスクリーニングなどが存在するが、本研究では1細胞RNA-Seqデータの、更にCCIという解像度が高い空間での、受容体-リガンド遺伝子の共発現を計測することから、従来のアッセイでは埋もれていた受容体-リガンドの関係性を検出できる可能性がある。 本研究では、以下で説明する、申請者の開発した手法scTensorに基づいており、1細胞RNA-Seqデータに当該手法を適用し、実際に生体内に含まれるCCIを網羅的に検出した上で、そのCCIの中で共発現するオーファン受容体とリガンドのペアを検出する。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本プロジェクトの基盤となっているscTensorについては、CCIを検出する上での根拠となっている、既知の受容体-リガンドペアの適切なペアリング方法、現在従来のCCI検出手法との比較、実データに対する有効性などを検証している段階であり、次年度中には論文として公開する予定である。 また、scTensorの開発と並行して、公開された1細胞RNA-Seqデータの二次利用も行っている。遺伝子発現量行列に対してscTensorを適用し、解析結果をレポートにしてまとめるという一連の解析をワークフローとして実装しているため、このワークフローをGEO・ArrayExpressなどの遺伝子発現量データベース上のデータに適用することで、解析済みファイルを蓄積してデータベース化をしているところである(CellCelldb)。現在CellCelldbは、15ヒトデータ、17マウスデータについて公開している。 また、上記のワークフローを全自動化する上で、scTensorのアルゴリズムの自動パラメーター推定の開発や、ワークフローをSnakemakeなどのワークフロー言語により実装することで、コードのポータビリティや、計算環境に依存しないコードを目指している。
|
Strategy for Future Research Activity |
まずは、scTensorの成果を、論文としてまとめることが先決だと考えている。これと並行して、CellCelldbの拡充化は、継続して行っていく予定である。1細胞RNA-Seqは現在広く普及しており、CCIに注目した論文も増えていることから、各種ゲノム系論文の発表を逐一チェックしつつ、100件程度まで、データを蓄積していく予定である。 網羅的にCCIが検出された後は、オーファン受容体(100)× 候補リガンド(1000)× CCI(100)という大規模なテンソルデータの解析が予想される。既存の実装では、このような大規模なデータを扱えない可能性もあるため、適宜非ゼロの値のみをメモリに載せる"スパーステンソル"や、データはハードディスクに置いたまま、必要な時にのみメモリ上に逐次的にデータを展開する"Out-of-core"な実装を利用することで対処する予定である(K. Tsuyuzaki, Genome Biology, 2020)。 また、オーファン受容体の候補リガンドについては、ドッキングシミュレーションによる検証や、実際に細胞を使ったアッセイなどで、多角的に検証する予定である。
|
Causes of Carryover |
scTensorなど、開発したパッケージの広報活動の一環として、ステッカーのデザインをデザイナーに依頼していたが、当初予定していた額を超えたため、前倒し支払い請求をした。その際に、他の用途での予算の利用も考え、やや多めの額を請求しておいたためにこのような額になった。
|