伊人99re_av日韩成人_91高潮精品免费porn_色狠狠色婷婷丁香五月_免费看的av_91亚色网站

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 軟件研發(fā) > “自助法”(bootstrapping)是一個比較好的解決方案

“自助法”(bootstrapping)是一個比較好的解決方案

2018-08-16 09:57:41 | 來源:中培企業(yè)IT培訓網(wǎng)

2.2.3  自助法
      我們希望評估的是用D訓練出的模型,但在留出法和交叉驗證法中,由于保留了一部分樣本用于測試,因此實際評估的模型所使用的訓練集比D小,這必然會引入一些因訓練樣本規(guī)模不同而導致的估計偏差.留一法受訓練樣本規(guī)模變化的影響較小,但計算復雜度又太高了:有沒有什么辦法可以減少訓練樣本規(guī)模不同造成的影響,同時還能比較高效地進行實驗估計呢?
  “自助法”(bootstrapping)是一個比較好的解決方案,它直接以自助采樣法(bootstrap sampling)為基礎(chǔ)[Efron and Tibshirani,1993].給定包含m個樣本的數(shù)據(jù)集D,我們對它進行采樣產(chǎn)生數(shù)據(jù)集D7:每次隨機從D中挑選一個樣本,將其拷貝放入D',然后再將該樣本放回初始數(shù)據(jù)集D中,使得該樣本在下次采樣時仍有可能被采到;這個過程重復執(zhí)行m次后,我們就得到了包含m個樣本的數(shù)據(jù)集D7,這就是自助采樣的結(jié)果.顯然,D中有一部分樣本會在D'中多次出現(xiàn),而另一部分樣本不出現(xiàn).可以做一個簡單的估計,樣本在m次采樣中始終不被采到的概率是(1 -擊)…,取極限得到即通過自助采樣,初始數(shù)據(jù)集D中約有36.8070的樣本未出現(xiàn)在采樣數(shù)據(jù)集D'中,于是我們可將D'用作訓練集,DD'用作測試集;這樣,實際評估的模型與期望評估的模型都使用m個訓練樣本,而我們?nèi)杂袛?shù)據(jù)總量約1/3的、沒在訓練集中出現(xiàn)的樣本用于測試.這樣的測試結(jié)果,亦稱“包外估計”(out-of-bagestimate).自助法在數(shù)據(jù)集較小、難以有效劃分訓練/測試集時很有用;此外,自助法能從初始數(shù)據(jù)集中產(chǎn)生多個不同的訓練集,這對集成學習等方法有很大的好處,然而,自助法產(chǎn)生的數(shù)據(jù)集改變了初始數(shù)據(jù)集的分布,這會引入估計偏差.因此,在初始數(shù)據(jù)量足夠時,留出法和交叉驗證法更常用一些.?

標簽: bootstrapping

相關(guān)閱讀

主站蜘蛛池模板: 亚洲国产三级片在线视频 | 国内一区二区三区 | 麻豆国产VA免费精品高清在线 | 高清无码午夜福利视频 | 日本久久久久久久久 | 亚洲第一区欧美国产综合 | 天地争霸美猴王42集免费看 | 成年免费大片黄在线观看一级 | 青青青手机频在线观看 | 欧美XXXXX高潮喷水麻豆 | 在线中文字幕亚洲 | 综合欧美亚洲日本 | 亚洲国产日韩精品乱码教育 | 女高中生边自慰边呻吟 | 国产98色在线| 各种场合大胆露出在线看 | 国产欧美日韩另类色视频云霸 | 国产白袜男gaychina霸道太子 | 国产福利写真片视频在线 | 55夜色66夜色国产精品视频 | 日韩精品成人在线 | 国产偷V国产偷V亚洲高清 | 国产精品日韩精品欧美精品 | 啊啊啊操的好爽 | 中文字幕+乱码+中文乱 | 久久国产精品大桥未久av | 亚洲视屏| 国产理论在线播放 | 久色婷婷| 一区二区三区毛片 | 亚洲龙腾成小说人网 | 东北妓女口爆吞精毛片 | 亚洲国产69 | 精品国产欧美一区二区三区成人 | 日韩激情视频一区 | 国产精品人妻熟女毛片av久久 | 色自拍偷拍| 亚洲一区二区三区波多野结衣 | 亚洲精品久久久狠狠狠爱 | 久久99精品久久久久久9 | a色网站|