2015 Fiscal Year Research-status Report
シーケンスデータに基づく、免疫レパートリ構造の統計的解析手法の構築
Project/Area Number |
15K14433
|
Research Institution | The University of Tokyo |
Principal Investigator |
小林 徹也 東京大学, 生産技術研究所, 准教授 (90513359)
|
Project Period (FY) |
2015-04-01 – 2017-03-31
|
Keywords | レパトア / T細胞 / バイオインフォマティクス / 低次元化 / LDA |
Outline of Annual Research Achievements |
今年度は主に高次元1細胞TCR配列データ集合に対して、低次元化などの手法を応用し、配列集合にある構造を発見的に解析する手法の検討を主に行った。 具体的には配列データ間の距離をSmith-waterman法で定量化し、多次元尺度構成法を用いた低次元化を複数のデータ(公開データ、共同研究者提供データ)について行った。その結果、各データがある種の明確なクラスター構造を有することを確認した。 更に、ジェンシェン・シャノン ダイバージェンスを用いて、異なる組織からの低次元化データを分布とみなして、その差異を同定する方法を検討した。 先行する階層的統計モデルの結果と比較し、同等の差異を同定できることを確認した。さらにこれを改良し、差異を作り出している部分集団を抽出する手法も提案した。合わせて、これらの手法の大規模データへの適用のため、プログラムの最適化などを行い、研究開始当初より数倍のデータを処理できるようにシステムを改良した。 また、28年度に計画していた機械学習階層モデルをTCR配列データに応用する研究についても、前倒しで着手をした。TCR配列ではなく、各TCR配列の生成に関わったVJ遺伝子のusage情報に着目し、TCRデータ集合の背後に存在するトピック構造をLatent Dirichelet Allocation(LDA)を用いて解析した。その結果、TCRのトピック構造とVJ遺伝子のゲノム上の位置関係の間に、非自明な相関があることを見出した。 これらの結果は27年度免疫学会にて報告をし、LDAの応用研究についてプレゼンテーション賞を受賞した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
意欲的な修士学生が研究に参画し、27年度の研究実施計画だけでなく、28年度に予定していた研究についても前倒しで研究を進めることができたため。
|
Strategy for Future Research Activity |
27年度で28年度で予定していた計画がかなり前倒しで進めることができたため、27年度に明らかになった幾つかの課題の検討も追加して進める。
27年度での予備的な結果から、MDA以外の低次元化方法や別の配列距離計算の方法も有効であることを見出している。28年度は当初計画に加えてこれらの異なる低次元化・距離計算手法の間の比較なども行い、各種法の有効性の比較を行う。 また当初予定取り、配列の変異や選択を考慮した低次元化やデータ縮約の方法の検討を行う。 さらに手法の有効性を更に検討するために、新しいシーケンスデータの作成なども視野に入れて研究を進める。
|
Causes of Carryover |
27年度幾つかの研究を前倒して開始することができたため、予定していた対外発表よりも研究の進行を優先して進め、その分の旅費が未使用となった。 また27年度の解析から現在使っているデータの有するバイアスなども懸案として出てきたため、検証に使える新たなデータを同予算を活用して独自に取得する方策についても検討を進めた。データ取得をする場合、28年度にそのための追加予算が必要となるため、上記の旅費を28年度に繰り越すことにした。
|
Expenditure Plan for Carryover Budget |
27年度にTRCシーケンス受託のベンチャー企業と交渉を開始し、共同研究契約を進めることができた。共同研究者らにサンプルを提供してもらえれば、新たなシーケンスを受託で取得できる。その方向で予算の活用を検討する。またあわせて、27年度での成果を海外で広く発表することも検討する。
|