2021 Fiscal Year Research-status Report
非負値テンソル分解を用いたオーファン受容体結合リガンドの同定及び機能解明
Project/Area Number |
19K20406
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
露崎 弘毅 国立研究開発法人理化学研究所, 生命機能科学研究センター, 基礎科学特別研究員 (70769520)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | バイオインフォマティクス / 1細胞RNA-Seq / 機械学習 / オミックス解析 / 次元圧縮 / テンソル分解 / 脱オーファン化 / 逆薬理学 |
Outline of Annual Research Achievements |
Gタンパク質共役型受容体は、既存薬の多くが関与する、重要な創薬ターゲットであるが、リガンド未知のオーファン受容体が未だ多く存在する。本研究では、非負値テンソル分解というアルゴリズムを利用して、1細胞RNA-Seqデータに含まれる細胞間相互作用(Cell-Cell Interaction: CCI)を網羅的に検出し、CCIに特異的に共発現するオーファン受容体とリガンドのペアを特定することで、オーファン受容体に結合するリガンド、及びそれらの結合が関与する細胞機能を同時に推定する。 本研究で得られる、オーファン受容体-リガンド-細胞機能の三項関係は、新規創薬ターゲットとして期待される。本研究で利用するアルゴリズム、非負値テンソル分解は、データをA×B×Cのように、三つ組の情報、テンソルとして表現し、その中に含まれる情報を少数のベクトルの外積として近似する。これにより、従来の行列分解ベースのアルゴリズムでは、「AとBの関係性」についてのパターンしか抽出できなかったのに対して、「AとBがCによって関係している」という、より高解像度なパターンの抽出が実現できる。非負値テンソル分解はすでにRのパッケージnnTensorとして実装してあり、1細胞RNA-Seqデータと、既知のリガンド・受容体を組み合わせることで、CCIを検出するRパッケージscTensorの内部で利用されている。 このscTensorの解析結果をデータベース化し、後述するように、創薬ターゲット候補となりうる、オーファン受容体を絞り込む。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本プロジェクトの基盤となっているscTensorについては、CCIを検出する上での根拠となっている、既知の受容体-リガンドペアの適切なペアリング方法、現在従来のCCI検出手法との比較、実データに対する有効性などを検証している段階であり、本年度中には論文として公開する予定である。 現在、そのscTensorの論文執筆作業に時間がかかっている。理由としては、CCI検出手法が乱立しており、競争が激化しているためである。現在は、CellPhoneDBなど、既報のCCI解析の多くで利用されているラベル並び替え検定と比較し、非負値テンソル分解のメリットをより明確にするために、大規模な人工データと、幾つかの実データを利用し、既存のCCIをどれだけ、正確に検出できているのか、検証実験を行っている。現在までのところ、ラベル並び替え検定は、1細胞型vs1細胞型間でのCCIの検出には特化しているものの、複数の細胞型vs複数の細胞型でのCCIの検出では、大幅に性能を落としていることを確認している。一方scTensorは、どのようなCCI様式であっても正確にCCIを検出できている事が確認されている。 現在までのところわかっているのは、ラベル並び替え検定は、片方の細胞型でのリガンド(もしくは受容体)の遺伝子発現量が高い場合、例えパートナーとなっている受容体(もしくはリガンド)の遺伝子発現量が低くても、誤ってそれらの間が相互作用しているとみなしてしまう偽陽性がある事がわかっており、一方scTensorでは、ベクトルの外積としてCCIを検出する関係から、そのような偽陽性が無いことがわかっている。 現在は、この比較検証結果を元に論文の執筆に取り掛かっている最中であり、終わり次第、scTensorをオーファン受容体検出へ応用する予定である。
|
Strategy for Future Research Activity |
上記の検証が終わり次第、以下の手順で、本研究テーマに取り組む。 手順1: scTensorを、既報の1細胞RNA-Seq研究データ(例: Gene Expression Omnibus, Single Cell Portal, Human Cell Atlas, Tabular Sapiens等)に適用し、網羅的にCCIを検出する。この作業は過去に既に行った事があり、CellCelldbというデータベース(https://q-brain2.riken.jp/CellCelldb/)でデータを公開しているため、このデータベースを拡充化することに相当する。 手順2: 拡充化されたCellCelldbのうち、CCI情報だけを抽出し、そのCCI内で共発現したオーファン受容体と、リガンドのペアを網羅的に探索する。 手順3: 検出したオーファン受容体とリガンドのペアをもとに、以下を明らかにする。 1. オーファン受容体と共発現する内在性リガンドは何か 2. それら共発現の生体内での分布や関与する細胞機能は何か 3. 実際にオーファン受容体と内在性リガンドは結合するか 4. どのような代理リガンドが設計できるか 5. 機能していないオーファン受容体は何か 6. 結合するリガンドが似ているオーファン受容体はどれか 7. 結合するリガンドが似ていないオーファン受容体はどれか 8. GPR35の機能解明
|
Causes of Carryover |
他のグラント(基礎特研やさきがけ)で賄えた分が大きかったため。ただし本年度は、独立も視野に入れ研究環境を一新する予定であるため、当科研費を積極的に利用し、本テーマを遂行していく予定である。
|