研究課題/領域番号 |
23K17274
|
研究機関 | 北海道大学 |
研究代表者 |
竹田 裕介 北海道大学, 理学研究院, 博士研究員 (50838852)
|
研究分担者 |
真鍋 真 独立行政法人国立科学博物館, 標本資料センター, コレクションディレクター (90271494)
|
研究期間 (年度) |
2023-06-30 – 2026-03-31
|
キーワード | 古生物学 / 自然史 / データキュレーション / データアーカイブ / ビッグデータ / 画像解析 / システム開発 |
研究実績の概要 |
X線CTに代表されるトモグラフィ技術の普及は,実物標本に基づいてきた自然史の調査・研究をデジタル3D空間上へ拡張させた.トモグラフィデータは試料全体の内・外部形態を連続的な断層画像セットに変換したもので,そこから3D復元も可能である.この高い情報量をもつデジタルデータは,博物館における新たなカテゴリーのコレクションとしてのポテンシャルが極めて高い.そこでトモグラフィ画像をキュレーション・アーカイブし,”デジタル化石鉱山”を構築することで新たな研究体制を開拓することが本研究の目的である.今年度は以下の研究開発を行った. 1.データキュレーションソフトウェア:トモグラフィ分析で得られた大規模画像データを自動で体系的に整理するものをpythonで開発した.ソフトウェアはGUIでユーザーフレンドリーに操作可能とした. 2.データキュレーションハードウェア:上述のソフトウェアを実行する低コストな計算機を開発した.小型PCを複数台用いて,スイッチングハブと10ギガビットイーサネットケーブルで有線接続することでPCクラスタを構築した.1.で開発したキュレーションソフトウェアによる処理を並列化し,高速・効率化した. 3.データの長期保存:キュレーションされたデータをLTO8テープにアーカイブし,ハードケースで保管する体制を確立した. 4.実践研究:トモグラフィデータの画像セグメンテーションに関する技術調査およびパイロットスケールの解析を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通りに,データキュレーションソフトウェア・ハードウェアの開発を実施することができた.デバッグ作業も完了し,システムは正常に運用中である.これにより,断層画像1枚ずつにコレクション番号を付してコレクション化することが可能となった.メタデータは自動作成されて,すべてのデータがそのまま博物館でコレクションできる形式でリネーム,ソーティングされる.また,データセットのオーバービューにも活用できる台帳を作成することにも成功した.システムの導入・操作手順をマニュアル化することで,ユーザー側に専門的なITの知識を求めずに運用可能とした.これらの機能・特徴はトモグラフィ画像の研究資源化に必須である. また,実践研究として画像セグメンテーションに関する研究を当初の計画に先んじて開始することができた. 以上のことから,おおむね順調に進展していると判断した.
|
今後の研究の推進方策 |
開発したソフトウェアとハードウェアを用いて,トモグラフィ画像のコレクション化を自動処理で進める.これと並行して実践研究として,トモグラフィデータのセグメンテーションに関する技術開発を継続し,大規模データに適応可能な解析方法の確立を目指す.また,データのオープン化に関して,データリポジトリやパブリッククラウドに関する調査を行う.
|
次年度使用額が生じた理由 |
トモグラフィ画像を処理するための並列PCクラスタ開発において,当初の想定よりも少ない台数で高パフォーマンスなクラスタを開発することができたためである.次年度ではトモグラフィデータの追加取得を予定している.これに伴って扱うデータが大規模化するため,PCクラスタの拡張およびデータストレージの構築に用いる計画である.
|