研究課題/領域番号 |
23KF0243
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 |
応募区分 | 外国 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 京都大学 |
研究代表者 |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
研究分担者 |
SUN LIANGJIE 京都大学, 化学研究所, 外国人特別研究員
|
研究期間 (年度) |
2023-11-15 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
1,300千円 (直接経費: 1,300千円)
2025年度: 400千円 (直接経費: 400千円)
2024年度: 500千円 (直接経費: 500千円)
2023年度: 400千円 (直接経費: 400千円)
|
キーワード | 自己符号化器 / 遺伝子ネットワーク / ニューラルネットワーク / 遺伝子発現 / ブーリアンネットワーク / ReLU関数 |
研究開始時の研究の概要 |
In this study, we develop novel computational methods for analyzing single-cell RNA sequencing data. In particular, we develop methods for cell-specific gene regulatory network inference using the probabilistic Boolean network model, methods for cell-type classification from single-cell gene expression data using autoencoders, and methods for cell-type specific control of gene regulatory networks.
|
研究実績の概要 |
様々なデータから特徴を自動的に抽出しベクトル化するためにニューラルネットワークの一種である自己符号化器が広く用いられている。自己符号化器は遺伝子発現データからの特徴抽出、さらには、遺伝子発現データからの細胞分類などにも有用であると考えられる。そこで、本研究では自己符号化器に関する基礎的な研究として、そのデータ圧縮能力と必要な頂点数の関係性について理論解析を行った。研究代表者らによる以前の研究において、活性化関数として線形閾値関数を用いた場合については解析されていたが、今回はより広く利用されているReLU(Rectified Linear Unit)関数を活性化関数として場合について研究を行った。その成果として、以下の結果を理論的に導くことができた。 (1) 線形閾値関数を用いた場合は0,1からなる2進数ベクトルしか対応できなかったが、ReLU関数を用いることにより実数ベクトルに対する自己符号化器の解析が可能となった。その結果、圧縮率と必要頂点数の関係を大きく変えることなく、以前の結果を実数値ベクトルに対応するモデルに拡張することができた。 (2) ReLU関数を用いることにより、線形閾値関数の場合では不可能であった、1次元のベクトルデータにまで圧縮することが可能であることを示した。 (3) 実数ベクトルにおける圧縮能力の比較のために線形関数を活性化関数として用いた場合にも理論解析を行い、ReLU関数を用いる方がより高い圧縮が可能であることを示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2023年11月に研究を開始したばかりであるが、まとまった理論的成果が得られるなど研究は順調に進展している。なお、当初の計画では遺伝子ネットワークの推定法を先に研究する予定であったが、以前に共同研究を行っていた自己符号化器の研究を進展させ完成させることが重要であると判断したので、研究の順番を変えて、自己符号化器の研究を優先することとした。
|
今後の研究の推進方策 |
自己符号化器の理論解析において入出力が完全に一致する場合を検討してきたが、それでは大量の頂点が必要となることが判明しつつある。その問題点に対処するために、研究代表者らの以前の研究において誤差を許した場合を検討していた。しかしながら。頂点数を大幅に削減することはできなかった。そこで、より多くの誤差を許した場合について検討を進め、必要とする頂点数を大幅に削減することを試みる。また、当初の計画にあげていた、1細胞遺伝子発現データからの遺伝子ネットワークの推定法や制御法についても検討も開始する。
|