2021 Fiscal Year Research-status Report
Development for automatic data analysis of large-scale glycomics
Project/Area Number |
21K12124
|
Research Institution | Niigata University |
Principal Investigator |
三浦 信明 新潟大学, 医歯学系, 特任准教授 (80372267)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 糖鎖リスト / SALSA / 血清グライコミクス / コホート / AI / Classifier |
Outline of Annual Research Achievements |
本課題では, グライコミクス支援ソフトウェアToolbox Accelerating Glycomics (TAG)の開発を推し進め, 多くのグライコームに対応した自動データ解析の基盤を構築する事にある. 本課題では(1)糖鎖リストの充実, (2)機種依存のできる限りの解消など本体の機能拡張, (3)糖鎖生合成マップの拡張を進める事としている. 本年度は, (1)についてはSALSA法への対応および酸性糖鎖残基としてシアル酸に加えグルクロン酸への対応を行った. またAOWRに加えBOAを非還元末端のラベルとして追加した. これらに伴って残基のIDの構造を変更しこれまでN型糖鎖については5種類, GSLについては10種類であった残基の基底を15種類に残基に統一した. (2)について, 大量の血清を扱う際の入力データを質量分析に用いるプレートへの点着情報から自動で作成する機能, 定量性を検証するための検量線を作成する機能を追加した. さらに同定した糖鎖組成から可能な糖鎖構造を調べるためにGlyconnect(https://glyconnect.expasy.org/)への検索リンクを追加した. 最新のM1チップを搭載したMacにも対応し使用できるプラットフォームを拡張した. (3)については(1)とも関連するが, 糖鎖残基のデータ構造を変更した事に対応して内部データの取り扱いを変更した. またN型糖鎖の2本差についてはSALSAやNeuGcに対応したパスウェイマップを試作として構築した. AIを用いた糖鎖パターンからの疾患や細胞の状態を分類する新機能TAG classifierを考案した. TAGの配布や変更点の周知のためにGithubにリポジトリhttps://github.com/nmiura3/tagを設置し情報発信を行っている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
大量の血清の糖鎖解析に利用可能とする基礎を構築するためにSALSAへの対応AOWRに加えてBOAラベル化への対応したリストの自動生成, 質量分析プレートの情報から自動で入力ファイルを作成する機能, 帰属した糖鎖組成に対する候補構造をデータベース検索する機能などを追加した. リストの拡張については当初予定していたSALSAのみならず様々な修飾や非還元末端ラベルに対応する事が可能となった. 糖鎖発現パスウェイについてもN型糖鎖の2鎖の部分に限定されるが新しい表示方法のプロトタイプを作成した. また利用者のPC環境的な要望からM1チップを搭載したMacへの対応も行った. これによって対応プラットフォームが増え使い勝手も向上している.
|
Strategy for Future Research Activity |
研究は順調に進捗しているので今後もおおむね当初の計画どおりに進めていきたい. 血清糖鎖の大量解析に耐えるソフトウェアにするために, これによって生じる課題もふくめ当初計画とのバランスを取りながら多少大規模解析の需要を優先して進める. 糖鎖リストを拡充したことと, 検量線の機能が加えられたことで血清の大規模解析には, 最低限耐えられるまでTAGが成長した. 千・万の血清を処理していくための準備を進めているが, いくつかの課題がある. 1つは現在のTAGでは容易にプラットフォームを拡張できるように, データ構造を固定して静的にデータを持つようにしている. 最初に候補構造を絞り込む際に相当大規模のリストを処理する必要があり, これに静的データ量の問題と処理時間の問題が課題となる事が, 今年度の研究からわかった. 対策としては, 前者に対しては他の言語などに移行して動的にメモリを確保するアルゴリズムでTAGを書き換える事, または有料のコンパイラを購入してより大きな静的メモリを確保できるようにする事が考えられている. 後者については一部アルゴリズムの見直しとより高速なコンピュータを導入する事を検討している.
|
Causes of Carryover |
昨年度,情報収集を行う予定であった学会などが別途業務と重なり出席できなかった事, あわせて研究打ち合わせについても, 新型コロナウイルス感染症に関する蔓延防止措置などの影響で十分に行う事ができなかったため, 約17万円ほどの研究費が次年度使用になってしまった. 本年度は, より積極的に研究打ち合わせを行うとともに, 「今後の研究の推進方策」で述べたように, 検討中の事項ではあるがコンパイラやPCなど物品の調達についても併せて検討したい. またTAGを使うプラットフォームが広がっていくにつれてテストするためのPCも必要となるためこれらの購入も必然的に予算を割くことになると考えている.
|
Research Products
(2 results)