將ROC曲線上的每個點轉(zhuǎn)化為代價平面上的一條線段,然后取所有線段的下界
2018-08-16 閱讀全文>>回顧前面介紹的一些性能度量可看出,它們大都隱式地假設(shè)了均等代價
2018-08-16 閱讀全文>>在現(xiàn)實任務(wù)中常會遇到這樣的情況:不同類型的錯誤所造成的后果不同.例如在醫(yī)療診斷中,錯誤地把患者診斷為健康人與錯誤地把健康人診斷為患者,看起來都是犯了“一次錯誤”
2018-08-16 閱讀全文>>現(xiàn)實任務(wù)中通常是利用有限個測試樣例來繪制ROC圖,此時僅能獲得有限個(真正例率,假正例率)坐標對,無法產(chǎn)生圖2 4(a)中的光滑ROC曲線,只能基于有限個測試樣例篆繪制出如圖2 4(b)所示的近似ROC曲線
2018-08-16 閱讀全文>>錯誤率和精度雖常用,但并不能滿足所有任務(wù)需求.以西瓜問題為例,假定瓜農(nóng)拉來一車西瓜,我們用訓(xùn)練好的模型對這些西瓜進行判別,顯然,錯誤率衡量了有多少比例的瓜被判別錯誤.
2018-08-16 閱讀全文>>調(diào)參得好不好往往對最終模型性能有關(guān)鍵性影響.給定包含m個樣本的數(shù)據(jù)集D,在模型評估與選擇過程中由于需要留出一部分數(shù)據(jù)進行評估測試,事實上我們只使用了一部分數(shù)據(jù)訓(xùn)練模型.
2018-08-16 閱讀全文>>大多數(shù)學(xué)習(xí)算法都有些參數(shù)(parameter)需要設(shè)定,參數(shù)配置不同,學(xué)得模型的性能往往有顯著差別.因此,在進行模型評估與選擇時,除了要對適用學(xué)習(xí)算法進行選擇,還需對算法參數(shù)進行設(shè)定,這就是通常所說的“參數(shù)調(diào)節(jié)”或簡稱“調(diào)參”(parameter tuning)
2018-08-16 閱讀全文>>“自助法”(bootstrapping)是一個比較好的解決方案
2018-08-16 閱讀全文>>留一法的估計結(jié)果也未必永遠比其他評估方法準確
2018-08-16 閱讀全文>>“交叉驗證法”(cross validation)先將數(shù)據(jù)集D劃分為尼、個大小相似的互斥子集,即D= Di u D2 u U Dk,DinDj=g(t≠j) 每個子集Di都盡可能保持數(shù)據(jù)分布的一致性,即從D中通過分層采樣得到
2018-08-16 閱讀全文>>一般要采用若干次隨機劃分、重復(fù)進行實驗評估后取平均值作為留出法的評估結(jié)果
2018-08-16 閱讀全文>>訓(xùn)練/測試集的劃分要盡可能保持數(shù)據(jù)分布的一致性
2018-08-16 閱讀全文>>訓(xùn)練樣本相當(dāng)于給同學(xué)們練習(xí)的習(xí)題,測試過程則相當(dāng)于考試
2018-08-16 閱讀全文>>我們可通過實驗測試來對學(xué)習(xí)器的泛化誤差進行評估并進而做出選在現(xiàn)實任務(wù)中往往會選擇
2018-08-16 閱讀全文>>與“過擬合”相對的是“欠擬合”(underfitting),這是指對訓(xùn)練樣本的一般性質(zhì)尚未學(xué)好
2018-08-16 閱讀全文>>29697條 上一頁 1.. 1542 1543 1544 1545 1546 ..1980 下一頁