研究課題/領域番号 |
16300088
|
研究種目 |
基盤研究(B)
|
研究機関 | 統計数理研究所 |
研究代表者 |
江口 真透 統計数理研究所, 統計基礎研究系, 教授 (10168776)
|
研究分担者 |
栗木 哲 統計数理研究所, 統計基礎研究系, 教授 (90195545)
藤澤 洋徳 統計数理研究所, 領域統計研究系, 助教授 (00301177)
松浦 正明 (財)癌研究会, ゲノムセンター, 部門長 (40173794)
宮田 敏 (財)癌研究会, ゲノムセンター, 研究員 (60360343)
金森 敬文 東京工業大学, 大学院・情報理工学研究科, 助手 (60334546)
|
キーワード | 関数データ解析 / 独立成分分析 / 自己組織化主成分 / 多重比較 / 一塩基多型 / 遺伝子発現 / バイオインフォマティクス / バイアスモデル |
研究概要 |
バイオインフォマティックスのための新たな統計科学を構築するための基礎固め、特にヒトゲノム多様性に由来する様々なデータから合理的な結論を得るための、統計的方法論の開発を目指し、研究を進めつつある。具体的な問題としては、遺伝子発現データからの難治性がん疾患遺伝子の発見や、SNPsデータから薬剤感受性を規定する遺伝子多型の同定を行うこと、などがある。これらの目的のために特化した4テーマを有機的に構築し、これらのテーマに沿って研究チームを組織、活動した. ・テーマ(1)プロテミクスからデータのための関数データ解析の開発:グループ1(藤澤、伏木、竹之内、江口) プロテオームからのデータに対して特に関数データ解析の適用を試みた。 ・テーマ(2)遺伝学の知識を援用した独立成分解析のモデリングからアルゴリズムの開発:グループ2(南、牛嶋、竹之内、江口) 教師なしデータの学習アルゴリズムとして独立成分分析からアプローチした。FastICAや同時対角化アルゴリズムの超高次元化バージョンを構築し,自己組織化主成分分析の援用した。 ・テーマ(3)統計的パタン識別のためのブースティング法とサポートベクターマシンの融合:グループ3(宮田、牛嶋、竹之内、江口) 統計的考察から特にゲノムデータの合理的適用には過大な特徴ベクトルの緩和のため特徴ベクトルの情報を選択的に学習する新しい正則化を開発した。 ・テーマ(4)複合的な仮説を包含する探索的推論から得られた結論の検証:(栗木、松浦、江口) 重合する仮説の集合から適合する仮説を選択すると多重性の問題が起こり、間違った見せかけの結論を導く危険性があるが,このような見せかけ新発見を防ぐ為の合理的で検証的な結論を保証する方法を開発しつつある.
|