Project/Area Number |
22K06190
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 43060:System genome science-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
中谷 明弘 東京大学, 大学院新領域創成科学研究科, 特任教授 (60301149)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | ミトコンドリア / 電子顕微鏡 / 畳み込みニューラルネットワーク / 転移学習 / 画像処理 / DNA配列変異 / 組み合わせ最適化 |
Outline of Research at the Start |
画像情報による形状や分布などの空間的な形質の多因子的な遺伝背景の解明に向けたデータ処理技術を開発する。心筋組織の電子顕微鏡画像中のミトコンドリア粒子や筋繊維を構成する部分構造間の空間的な相互関係を保持するデータ構造を構築して形状や分布に関する多様性を量的な形質としてモデル化する手法を開発する。ゲノムワイドに取得された配列変異間の相互関係を階層的に保持するデータ構造を構築して遺伝要因の多因子的な組み合わせ効果を高速に探索する統計学的手法を開発する。臨床情報や環境情報を加味しながらPhenotype-Genotype関連解析を実施できる枠組みを構築して実データへの適用を通じて有用性の検証を行う。
|
Outline of Annual Research Achievements |
ラベル付きの画像データセットとして公開されているImageNetの中の1000クラスを学習済みの畳み込みニューラルネットワーク(CNN)であるResNet18の出力層のみを差し替えて再学習(転移学習)することにより心筋の電子顕微鏡画像から切り出した画像パッチを分類する手法の開発を進めた。これまでに、組織の分類クラスを指定して電子顕微鏡画像からの画像パッチの切り出しを行うユーザインターフェースとデータセット管理システムを整備した。実際の電子顕微鏡画像からミトコンドリア粒子と筋原繊維および背景が写った3種類の画像パッチ(各100枚)を取得し、その内の70枚ずつから画像処理(切抜や回転)によって加工して同一サイズに定形化した画像パッチ(学習データ)で転移学習したCNNを用いて残りの30枚ずつ(評価データ)の分類を行って一定の精度が達成できることを確認した。CNNの構築はPython言語用の機械学習ライブラリであるPyTorchを用いて行った。画像パッチを切り出した原画像に学習したCNNを適用することによって電子顕微鏡画像の全域にわたって分類ができることを確認した。その際には、特定の分類クラスであることの確からしさ(確率)が数値的に得られるため、分類精度が十分ではない領域やいずれの分類クラスにも該当しない領域を抽出することも可能となっている。分類結果を参照しながら学習データの追加と分類クラスの増減を繰り返してCNNの最適化を行うことも可能である。同一の電子顕微鏡画像を対象とした学習と分類のみではなく、複数の電子顕微鏡画像を用いた学習や学習データを取得した電子顕微鏡画像とは別の新規の画像での分類も可能である。分類クラスそれぞれに色を割り当て、分類の確からしさに応じて彩度を割り当てることによって電子顕微鏡画像を分類クラスごとに塗り分けた信頼度付きの擬似カラー化処理が可能になっている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
手動で切り出した画像パッチを用いた学習と分類が汎用の画像分類用の畳み込みニューラルネットワーク(CNN)を用いた転移学習で可能であることを確認した。その際には、目視による切り出し処理時に暗黙の内に分類結果が明確な(分類が容易な)領域が選択されている可能性があるが、転移学習の結果得られたCNNは電子顕微鏡画像の全域への適用も十分に可能であることを確認した。目視での判別が難しい領域でも数値的な確からしさに基づいた分類結果を出力すると共に、分類の精度が高くなかった領域から学習データを追加することによりCNNの改善を行うことが可能であることを確認した。人間の直観的な判断と計算機の数値的な判定が補完し合ってCNNによる分類モデルの改善を効率良く行う仕組みを開発した。
|
Strategy for Future Research Activity |
電子顕微鏡画像内でのミトコンドリア粒子をはじめとする組織の形状と位置に関する幾何学的な情報を再構築する手法の開発を進めて、画素による「点」の情報を「曲線」や「領域」といったより高次の情報に構成する。ミトコンドリア粒子の位置や大きさに加えて輪郭の曲率や粒子内の画素値の頻度分布などを1粒子ごとの属性として定量化する。ミトコンドリア粒子をノードとして電子顕微鏡画像内で位置的に近接する粒子間をエッジで結線した粒子ネットワークを作成して粒子の分布の全体像を再構築する。連結度の高い部分ネットワーク(連結成分)に基づいて画像の領域分割を行って特定の特性のミトコンドリア粒子群がどのように分布しているかを定量化する手法を開発する。 ゲノムワイドに検出されるDNA配列の変異を対象として、検体群内での変異パタンの相関関係を保持する変異間ネットワークを構築してゲノムデータの全体像を俯瞰しながら網羅的なデータ処理を実現する手法の開発を進める。DNA配列のウィンドウサーチで得られる近接した変異を検体群内での変異パタンの相関関係(連鎖不平衡)に基づいて再帰的なブロック構造として構成し、それらブロック構造(木構造)を変異パタンの相関関係に従って染色体内外でリンクしてゲノムワイドなネットワーク状のデータ構造を構築する手法を開発する。予め準備したリンクを辿ることによって計算し直すことなく特定の変異と相関した変異群を取得できるようにする。また、ブロック化の粒度やリンク時の閾値を調整することにより、着目するデータの単位をゲノム全域から染色体、染色体部分領域、連鎖不平衡領域、塩基まで変化させながら解析や可視化を実現する手法を開発する。
|