研究実績の概要 |
本研究の目的は、RNA-seqデータ解析を感度・特異度高く行うための手法開発および手法選択に関するガイドラインの策定である。平成26年度は、これまで得られた知見をもとにトランスクリプトーム解析のためのガイドラインを書籍化した(門田幸二 著, シリーズ Useful R 第7巻 トランスクリプトーム解析, 共立出版, 2014)。また、サンプル間クラスタリングのこれまでの主な目的は、「外れサンプル」の同定や全体的な傾向の把握であるが、クラスタリング結果と発現変動遺伝子(DEG)の関係についても一定の傾向を見出した。具体的には、比較するグループ間でDEGが数多く存在するときにはグループごとのクラスターに明瞭に分かれ、DEGが存在しないときには明瞭に分かれない傾向にあることを見出した。 もちろん発現レベルのダイナミックレンジが広いRNA-seqカウントデータを入力とする場合、多くを占める低発現転写物(または遺伝子)のフィルタリングや用いる類似性尺度も重要である。平成26年度は論理的に妥当だと思われるフィルタリング手段として、ユニークな発現パターンのもののみに対してSpearman相関係数を用いて頑健にクラスタリングを実行する関数cluterSampleを作成し、平成25年度に開発したRパッケージTCC (http://www.bioconductor.org/packages/release/bioc/html/TCC.html)中に実装した。このDEGの有無やDEG数との関連についての知見の報告は、3,4群間比較解析手法の評価を行った論文の一部としてまとめ投稿した。
|