研究分担者 |
松浦 正明 (財)癌研究会, ゲノムセンター, 部門長 (40173794)
藤澤 洋徳 統計数理研究所, 領域統計研究系, 助教授 (00301177)
南 美穂子 統計数理研究所, 統計基礎研究系, 助教授 (70277268)
牛嶋 大 (財)癌研究会, ゲノムセンター, 研究員 (60328565)
宮田 敏 (財)癌研究会, ゲノムセンター, 研究員 (60360343)
|
研究概要 |
1.メタアナライシス・アプローチ 異なる研究施設の遺伝子発現データをブリッジングスタディをすることの問題点について8月,9月に滞在したJ.B.Copas教授(ウォーリック大学)と討論,妥当性の検討をした.特にメタアナライシスの適用可能性について様々な観点から検討を加え,その結果,研共同研究の方向が見出された.IPD(Individual Patient Data)アプローチからの興味ある方法が提案された.このプロジェクトには逸見(統計科学,総研大,修了予定)の積極的な参加がある.また松浦からデータ管理のアイデアが提案された.遺伝子発現のデータベースについて,国立遺伝学研究所の舘野研究室を2度訪問し,意見交換をした結果,今後の共同プロジェクトの合意を得た.来年度はこのアプローチの展開が主導になると考える. 2.ブースティング法の適用 最近,提案,考察されたU-ブーストについて適用可能性について検討した.特にイータブーストのミスラベル・ロバストネスは,医療診断などラベルの観測にノイズが入る場合に有効であるが,この方法論について検討した.更に,推測と予測問題について,南,川喜田(統計科学,総研大,博士課程1年)が非対称アダブーストについて試験的な検証を実施した.また過剰な特徴次元から生じる過学習の問題について,竹之内(統計科学,総研大,修了予定)からグループアダブーストのアイデアが出され,本格的な解析が舘野研究室グループとの共同で開始されている. 3.独立成分分析と主成分分析 ラベルの情報を意図的に無視して自己組織化主成分分析(J Machine Learning Researchに掲載予定)を遺伝子発現データに適用した.これとラベルの情報と照らし合わせると矛盾しない好結果が得られた.この方向を江口,牛嶋によってさらに追求する必要がある 今後,更なる発展を目指してこの萌芽研究を本格化したい.そのため,さらなる実用化が今後に残された課題であると認識している.
|