研究課題/領域番号 |
18K11521
|
研究機関 | 東京大学 |
研究代表者 |
門田 幸二 東京大学, 情報学環・学際情報学府, 准教授 (60392221)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 研究倫理 / 文献調査 / ガイドライン / データ正規化 / カウントデータ / RNA-seq |
研究実績の概要 |
ウェブサイト「(Rで)塩基配列解析」は、主に塩基配列データや遺伝子発現データ解析をフリーソフトウェアRで効率的に行うための包括的な情報サイトである。本研究は、ウェブサイト (Rで)塩基配列解析の安定的な提供を目指し、①情報更新および②情報拡充を行うことを目的としている。 今年度も昨年度に引き続き、文言の表記ゆれやリンク切れの修正、新規項目や最新プログラムおよび原著論文の追加といった地味な作業を中心に行った。特にsingle-cell RNA-seq (scRNA-seq)解析関連の項目を重点的に追加したが、この過程でこれまでbulk RNA-seqの論文中で報告済みのいくつかの事柄が無視されていることに気づいた。具体的には、「bulk RNA-seq用に開発された"有名な"データ正規化法」を「発現変動遺伝子数やその群間での偏りが非常に大きいscRNA-seq用に開発されたデータ正規化法」と比較し、後者のほうがよいと結論付ける高インパクト論文を発見した。一見まともそうなロジックに思えるが、実際には「発現変動遺伝子数やその群間での偏りが非常に大きい場合にも対応可能なbulk RNA-seq用の頑健なデータ正規化法」は存在する(がそれとの比較がなされていない)。また、scRNA-seqをbulk RNA-seqと区別する大きな特徴として、ゼロカウントのデータの多さ(ゼロ過剰)もしばしば強調されている。しかしながら、おそらく最初にゼロ過剰の特徴について報告がなされたのは、2013年のbulk RNA-seq用カウントデータモデル論文である可能性が高い。これらの調べた限りの事実関係を論文にまとめた(投稿中)。 他には、多群間比較時に発現変動パターンの同定まで行う場合のガイドラインに関する要望が寄せられていたため、推奨解析ガイドライン論文を公開した(Osabeら, 2019)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
地味な作業が中心であるため、「当初の計画以上に進展がなされる」ことはない。しかし、これまで同様、可能な限り多くの時間を割いてやるべき作業が行えたと判断している。
|
今後の研究の推進方策 |
科学者は、他の科学者の研究成果や業績を正当に評価し尊重すべきである。(https://www.jsps.go.jp/j-kousei/data/rinri.pdfの12ページ)。最終年度は、事実関係をできるだけ丁寧かつ詳細に調べ間違いを正した、投稿中の批評論文の受理を目指す。また、新規項目や最新プログラムおよび原著論文の追加といった地味な作業を引き続き丁寧に行う予定である。
|
次年度使用額が生じた理由 |
論文投稿状況は、ハンドリング不可能であるため。
|