研究課題/領域番号 |
22K06190
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分43060:システムゲノム科学関連
|
研究機関 | 東京大学 |
研究代表者 |
中谷 明弘 東京大学, 大学院新領域創成科学研究科, 特任教授 (60301149)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | ミトコンドリア / 電子顕微鏡 / 畳み込みニューラルネットワーク / 転移学習 / 画像処理 / DNA配列変異 / 組み合わせ最適化 |
研究開始時の研究の概要 |
画像情報による形状や分布などの空間的な形質の多因子的な遺伝背景の解明に向けたデータ処理技術を開発する。心筋組織の電子顕微鏡画像中のミトコンドリア粒子や筋繊維を構成する部分構造間の空間的な相互関係を保持するデータ構造を構築して形状や分布に関する多様性を量的な形質としてモデル化する手法を開発する。ゲノムワイドに取得された配列変異間の相互関係を階層的に保持するデータ構造を構築して遺伝要因の多因子的な組み合わせ効果を高速に探索する統計学的手法を開発する。臨床情報や環境情報を加味しながらPhenotype-Genotype関連解析を実施できる枠組みを構築して実データへの適用を通じて有用性の検証を行う。
|
研究実績の概要 |
ラベル付きの画像データセットとして公開されているImageNetの中の1000クラスを学習済みの畳み込みニューラルネットワーク(CNN)であるResNet18の出力層のみを差し替えて再学習(転移学習)することにより心筋の電子顕微鏡画像から切り出した画像パッチを分類する手法の開発を進めた。これまでに、組織の分類クラスを指定して電子顕微鏡画像からの画像パッチの切り出しを行うユーザインターフェースとデータセット管理システムを整備した。実際の電子顕微鏡画像からミトコンドリア粒子と筋原繊維および背景が写った3種類の画像パッチ(各100枚)を取得し、その内の70枚ずつから画像処理(切抜や回転)によって加工して同一サイズに定形化した画像パッチ(学習データ)で転移学習したCNNを用いて残りの30枚ずつ(評価データ)の分類を行って一定の精度が達成できることを確認した。CNNの構築はPython言語用の機械学習ライブラリであるPyTorchを用いて行った。画像パッチを切り出した原画像に学習したCNNを適用することによって電子顕微鏡画像の全域にわたって分類ができることを確認した。その際には、特定の分類クラスであることの確からしさ(確率)が数値的に得られるため、分類精度が十分ではない領域やいずれの分類クラスにも該当しない領域を抽出することも可能となっている。分類結果を参照しながら学習データの追加と分類クラスの増減を繰り返してCNNの最適化を行うことも可能である。同一の電子顕微鏡画像を対象とした学習と分類のみではなく、複数の電子顕微鏡画像を用いた学習や学習データを取得した電子顕微鏡画像とは別の新規の画像での分類も可能である。分類クラスそれぞれに色を割り当て、分類の確からしさに応じて彩度を割り当てることによって電子顕微鏡画像を分類クラスごとに塗り分けた信頼度付きの擬似カラー化処理が可能になっている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
手動で切り出した画像パッチを用いた学習と分類が汎用の画像分類用の畳み込みニューラルネットワーク(CNN)を用いた転移学習で可能であることを確認した。その際には、目視による切り出し処理時に暗黙の内に分類結果が明確な(分類が容易な)領域が選択されている可能性があるが、転移学習の結果得られたCNNは電子顕微鏡画像の全域への適用も十分に可能であることを確認した。目視での判別が難しい領域でも数値的な確からしさに基づいた分類結果を出力すると共に、分類の精度が高くなかった領域から学習データを追加することによりCNNの改善を行うことが可能であることを確認した。人間の直観的な判断と計算機の数値的な判定が補完し合ってCNNによる分類モデルの改善を効率良く行う仕組みを開発した。
|
今後の研究の推進方策 |
電子顕微鏡画像内でのミトコンドリア粒子をはじめとする組織の形状と位置に関する幾何学的な情報を再構築する手法の開発を進めて、画素による「点」の情報を「曲線」や「領域」といったより高次の情報に構成する。ミトコンドリア粒子の位置や大きさに加えて輪郭の曲率や粒子内の画素値の頻度分布などを1粒子ごとの属性として定量化する。ミトコンドリア粒子をノードとして電子顕微鏡画像内で位置的に近接する粒子間をエッジで結線した粒子ネットワークを作成して粒子の分布の全体像を再構築する。連結度の高い部分ネットワーク(連結成分)に基づいて画像の領域分割を行って特定の特性のミトコンドリア粒子群がどのように分布しているかを定量化する手法を開発する。 ゲノムワイドに検出されるDNA配列の変異を対象として、検体群内での変異パタンの相関関係を保持する変異間ネットワークを構築してゲノムデータの全体像を俯瞰しながら網羅的なデータ処理を実現する手法の開発を進める。DNA配列のウィンドウサーチで得られる近接した変異を検体群内での変異パタンの相関関係(連鎖不平衡)に基づいて再帰的なブロック構造として構成し、それらブロック構造(木構造)を変異パタンの相関関係に従って染色体内外でリンクしてゲノムワイドなネットワーク状のデータ構造を構築する手法を開発する。予め準備したリンクを辿ることによって計算し直すことなく特定の変異と相関した変異群を取得できるようにする。また、ブロック化の粒度やリンク時の閾値を調整することにより、着目するデータの単位をゲノム全域から染色体、染色体部分領域、連鎖不平衡領域、塩基まで変化させながら解析や可視化を実現する手法を開発する。
|