<style id="6w1ef"><meter id="6w1ef"></meter></style>

<cite id="6w1ef"><listing id="6w1ef"></listing></cite>

首頁合作企業(yè)服務

開發(fā)者出海圈專欄專題數(shù)據(jù)報告問答活動

跨境電商出海排行榜

搜索

發(fā)布合作

Epoch不僅過時，而且有害？Reddit機器學習板塊展開討論

來源：量子位

作者：關注前沿科技

時間：2021-05-08

有一天，一個調(diào)參俠在訓練一個深度學習模型，要用到的兩個數(shù)據(jù)集損失函數(shù)不同，數(shù)據(jù)集的大小還不是固定的，每天都在增加。他有點發(fā)愁，這該怎么設置Epoch數(shù)呢？于是他在Reddit發(fā)起了討論

有一天，一個調(diào)參俠在訓練一個深度學習模型，要用到的兩個數(shù)據(jù)集損失函數(shù)不同，數(shù)據(jù)集的大小還不是固定的，每天都在增加。

他有點發(fā)愁，這該怎么設置Epoch數(shù)呢？

在糾結(jié)的過程中，他突然想到：干嘛非得定一個Epoch數(shù)？只要對每個Batch進行獨立同分布抽樣 (IID Sampling)不就得了。

為了驗證這個想法，調(diào)參俠去看了很多論文。發(fā)現(xiàn)越來越多的人介紹他們的訓練方法時，只說進行了多少個Iteration，而拋棄了Epoch。

他想到，Epoch暗示并強調(diào)了數(shù)據(jù)集是有限的，這不僅麻煩，還有潛在的“危害”。把Epoch去掉，讓循環(huán)嵌套的層數(shù)少一層總是好的。

于是他在Reddit發(fā)起了討論：Epoch是不是過時了，甚至還有危害？

Epoch多余嗎？

有人對這個觀點表示贊同：

挺有道理，當數(shù)據(jù)集大小有很大差距，Batch大小相同時，設置一樣的Epoch數(shù)，豈不是大數(shù)據(jù)集參數(shù)更新的次數(shù)多，小數(shù)據(jù)集參數(shù)更新次數(shù)少了，這似乎不對勁。
Epoch最大的好處是確保每個樣本被定期使用。當使用IID抽樣時，你只要能想辦法確保所有樣本被同樣頻繁的使用就好了。

但調(diào)參俠覺得讓每個樣本被定期使用就是他懷疑的點，IID抽樣已經(jīng)確保分布相同了，再讓他們同頻率被使用就是一種誤導。

反對者認為：

不能因為你覺得車沒開在路的正中間就放開方向盤不管了，雖然大撒把不會改變你正好在路中間的概率，但它增加了方差。

調(diào)參俠最后總結(jié)道，這個爭議有點像統(tǒng)計學里的“頻率派 VS 貝葉斯派”，即認為數(shù)據(jù)集到底應該是確定的還是不確定的。

該怎么比較模型？

調(diào)參俠還注意到，有人用Batch Loss做損失曲線。他認為這比Epoch Loss更有參考價值。

反對者覺得，你這個方式是挺好的，但Epoch依然有用。

因為即使在相同的硬件上，不同模型的算法效率不同也會帶來巨大差異。

像各種Transformer和CNN這種底層代碼實現(xiàn)都差不多，但是別的模型就可能有很不一樣。比如我們自己的CUDA LSTM實現(xiàn)，至少和CudnnLSTM一樣快，比原版TensorFlow實現(xiàn)快4倍左右。

最后，有個網(wǎng)友以CV模型為例對這個話題做出精彩總結(jié)，列了4種損失可視化方式，并介紹了什么情況該用哪個。

Loss/Epoch告訴你一個模型要觀察同一個圖像多少次才能理解它。

Loss/Iteration告訴你需要多少次參數(shù)更新。當比較優(yōu)化器時這很有用，可以幫助你加快訓練速度或達到更高的精度。

Loss/Total Image Seen告訴你算法看到了多少圖像時的損失。適合比較兩種算法使用數(shù)據(jù)的效率。

如果你的算法在50萬張時達到70%、100萬張時達到75%，這可能比50萬張時達到50%，100萬張時達到80%的還要好。

另外，它還消除了Batch Size的影響。這允許在不同GPU上訓練的具有不同Batch Size的模型之間進行公平地比較。

Loss/Time也很重要，因為如果一個新模型減少了100個Epoch，但每個Iteration都慢100倍，我就不會選擇這個模型。

雖然Loss/Time關系到硬件的具體表現(xiàn)，不夠精準，我不會把這個寫到論文里。但在自己的機器上這是很好的評估模型的參數(shù)。

使用數(shù)據(jù)增強時呢？

有網(wǎng)友提出，數(shù)據(jù)增強 (Data Augmentation)時Epoch也有點多余。因為數(shù)據(jù)集太小，人為給每個樣本添加很多只有微小差距的版本，沒必要讓他們被同頻率使用。

反對者認為，數(shù)據(jù)增強作為正則化的一種形式減少了過擬合，但你引入的實際信息在訓練模型時仍然局限于原始數(shù)據(jù)集。如果你的原始數(shù)據(jù)集足夠小，Epoch表示你向模型展示了整個訓練集，仍然是有意義的。

有人問道：

你是想表達“紀元(Epoch)”的紀元結(jié)束了嗎？

調(diào)參俠：

對，現(xiàn)在是“時代(Era)”的時代。

△無盡隨機增強的首字母縮寫ERA意為“時代”

立即登錄，閱讀全文

reddit

上一篇：TikTok推出LeadGeneration方案，幫助廣告主觸達消費者并提高轉(zhuǎn)化率

版權(quán)說明：

本文內(nèi)容來自于量子位，本站不擁有所有權(quán)，不承擔相關法律責任。文章內(nèi)容系作者個人觀點，不代表快出海對觀點贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關文章

亮劍谷歌：Reddit推出AI站內(nèi)搜索工具Answers

亮劍谷歌：Reddit推出AI站內(nèi)搜索工具Answers

社區(qū)Reddit昨日（12月9日）發(fā)布公告，宣布推出AI驅(qū)動搜索工具Reddit Answers，目的是進一步提升平臺信息檢索效率。

2024-12-122024-12-12

Reddit Q5營銷新機遇

Reddit Q5營銷新機遇

Q5營銷季即將來臨！從圣誕節(jié)后（12月26日）持續(xù)至次年1月初！對于消費者和品牌來說，這是一個黃金時期。

2024-11-302024-11-30

Reddit如何助力跨境引流？帶入門Reddit

Reddit如何助力跨境引流？帶入門Reddit

在當今的跨境電商環(huán)境中，如何有效引流并吸引潛在客戶一直是各商家關注的重點問題。

2024-11-132024-11-13

知乎如何盈利這個問題，海對面的Reddit有了答案

知乎如何盈利這個問題，海對面的Reddit有了答案

“他們都不看好你，偏偏你最爭氣”，距離今年春季被投資機構(gòu)嫌棄的IPO僅僅半年時間，“美國貼吧”Reddit就宣布盈利了。還順便在美股上演了一出“三十年河東、三十年河西，莫欺少年窮”的戲碼。

2024-11-092024-11-09

Reddit

Reddit是美國最大的網(wǎng)上社區(qū)，用戶自動發(fā)掘內(nèi)容和分享的平臺，新鮮事件和熱點事件的源頭。

206

文章數(shù)

249.9W+

瀏覽量

216

粉絲

熱門活動

更多

8月1日ChinaJoy After Party

2025 AlgoriX Chat & Chill Cafe

熱門文章

POD定制網(wǎng)站費用準備：打造個性化電商平臺的支付利器

POD定制網(wǎng)站費用準備：打造個性化電商平臺的支付利器

PhotonPay光子易以全場景支付亮相2025游茶對接會

PhotonPay光子易以全場景支付亮相2025游茶對接會

2025-08-05

756

全球AI監(jiān)管升級，PhotonPay光子易為開發(fā)者保駕護航

全球AI監(jiān)管升級，PhotonPay光子易為開發(fā)者保駕護航

2025-08-05

364

金融速遞：美參議員提案認可加密資產(chǎn)影響房貸資格

金融速遞：美參議員提案認可加密資產(chǎn)影響房貸資格

2025-07-30

3001

突發(fā)！跨境假發(fā)大王被立案

突發(fā)！跨境假發(fā)大王被立案

2025-07-29

2835

優(yōu)質(zhì)服務商推薦

更多

DLOCAL LLP

dLocal 在新興市場提供本地支付服務，連接全球企業(yè)商家與亞太地區(qū)、中東、拉丁美洲和非洲數(shù)十億新興市場消費者。通過“一站式 dLocal”理念（一個直接 API、一個平臺和一個合同），全球公司無需管理多個本地實體和集成，即可接受支付、發(fā)送付款并在全球范圍內(nèi)結(jié)算資金。

CCPayment

CCPayment 創(chuàng)立于2015年，是一家全球領先的加密支付服務商，支持900多種代幣，服務覆蓋加密代收、加密代付、多幣種結(jié)算與匯兌管理等，致力于為企業(yè)提供高效、安全、低成本的加密支付解決方案，平臺支持多種支付模式，集成便捷，并通過加密與風控技術全面保障資金安全，助力企業(yè)快速出海。

深圳市光子躍動科技有限公司

PhotonPay光子易

光子易（PhotonPay）是一家領先的全球支付平臺及數(shù)字金融基礎設施提供商，服務覆蓋全球賬戶、全球發(fā)卡、全球收單、全球分發(fā)、匯兌管理和嵌入式金融等領域，致力于為全球企業(yè)提供安全、高效的數(shù)字化支付解決方案。

公司簡介

快出海是國內(nèi)領先的互聯(lián)網(wǎng)出海合作平臺，通過整合行業(yè)優(yōu)質(zhì)資源，為出海企業(yè)提供產(chǎn)品展示和資源對接平臺，助力中國互聯(lián)網(wǎng)企業(yè)走向全球。查看更多>

公司簡介

聯(lián)系我們免責申明合作伙伴

關注我們

微信訂閱號>

微信服務號>

快出海小程序>

聯(lián)系我們

快出海小程序

快出海公眾號

<i id="qnge9"></i>