ブースティング法に基づくデータ解析 ―理論的拡張と多変量解析への応用―
Project/Area Number |
09J00302
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Statistical science
|
Research Institution | Osaka University |
Principal Investigator |
林 賢一 大阪大学, 基礎工学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2009 – 2010
|
Project Status |
Completed (Fiscal Year 2010)
|
Budget Amount *help |
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2010: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2009: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | 教師あり学習 / 非対称ミスラベルデータ / ブースティング / ミスラベルモデル / ロバストネス |
Research Abstract |
本年度の主な成果は,論文の採択と国際学会での口頭発表,在外研究である.まず,カリフォルニア大学バークレー校統計学部のBin Yu教授のもとで在外研究を行った.Bin教授はブースティングの統計学的研究の先駆者であり,彼女の研究グループが現在注力しているスパース推定問題やテキストマイニングの問題と,私の研究テーマである非対称ミスラベルデータを関連付けて研究を行った.非対称ミスラベルデータは,観測ラベルが真のラベルと異なる確率が,真のラベルの値そのものに依存するようなデータ発生メカニズムを指す.このような例として,社会科学における飲酒量の調査などが挙げられる.この場合,社会的望ましさの影響から回答に虚偽が混入することが考えられる.これらがミスラベルデータである.この例では望ましくないラベルを真に持つ者が望ましいラベルを回答するという虚偽が存在することが考えられるが,その逆は考えられない.このように,ミスラベルの起こり方に「非対称性」が存在すると推定や予測においてバイアスが生じる.いくつかの非対称ミスラベルメカニズムに対するブースティングを提案し,バンクーバーで行われたJoint Statistical Meetingにて口頭発表を行った.また,これに関する論文が1本採択された.さらにミスラベル確率を規定するパラメータの推定問題にも取り組んだ.また,一般的にはミスラベルのメカニズムは事前に明らかではないので,これをあらかじめ特定しないでミスラベルの影響を除去する方法論についても研究を行った.
|
Report
(2 results)
Research Products
(5 results)