女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習模型在生產中退化的原因

汽車玩家 ? 來源:AI公園 ? 作者:Alexandre Gonfalonier ? 2020-05-04 12:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

當你把一個模型投入生產,它就開始退化,那這個時候,我們該怎么辦呢。

由于意外的機器學習模型退化導致了幾個機器學習項目的失敗,我想分享一下我在機器學習模型退化方面的經驗。實際上,有很多關于模型創建和開發階段的宣傳,而不是模型維護。

假設機器學習解決方案一旦投入生產,無需維護就能完美運行,這是一個錯誤的假設,是企業將其首款人工智能(AI)產品推向市場時最常見的錯誤。

當你把一個模型投入生產,它就開始退化

為什么機器學習模型會隨著時間退化?

你可能已經知道,數據是成功的ML系統中最重要的組成部分。有一個相關的數據集為你提供準確的預測是一個很好的開始,但是這些數據提供準確的預測能持續多久呢?

在所有ML項目中,預測數據將如何隨時間變化是關鍵。在一些項目中,我們低估了這一步,并且很難交付高精確度。在我看來,一旦你在PoC階段之后對你的項目有信心,就應該制定一個計劃來保持模型的更新。

事實上,在開始使用它之前,你的模型的準確性將處于最佳狀態。這一現象被稱為概念漂移,盡管在過去的20年里學術界對其進行了大量的研究,但在行業最佳實踐中它仍然經常被忽略。

概念漂移:表示模型試圖預測的目標變量的統計特性隨著時間以不可預見的方式發生變化。這導致了一些問題,因為隨著時間的推移,預測的準確性會降低。

機器學習模型在生產中退化的原因

關鍵是,與計算器相比,ML系統確實與現實世界交互。如果你使用ML來預測你的商店的需求和價格,你最好考慮一下本周的天氣、日歷和你的競爭對手在做什么。

在概念漂移的情況下,我們對數據的解釋隨時間而變化,而數據的一般分布則沒有變化。這導致最終用戶將模型預測解釋為隨著時間的推移,對相同/相似數據的預測已經惡化。數據和概念都可能同時漂移,使問題更加棘手。

我注意到,依賴于人類行為的模型可能特別容易退化。顯然,風險可以根據項目的性質進行預測。在大多數情況下,必須制定定期的模型評審和再訓練計劃。

此外,大多數模型只能捕獲反映它們所看到的訓練數據的模式。一個好的模型捕獲了這些數據的基本部分,而忽略了不重要的部分。這創建了泛化的性能,但是任何模型都有一定程度的局限性。

泛化:指的是你的模型能夠適當地適應新的、以前未見過的數據,這些數據來自于用于創建模型的相同分布。這與過擬合的概念密切相關。如果你的模型過擬合,那么它就不能很好地泛化。

機器學習模型在生產中退化的原因

泛化性能的最佳測試是查看模型在很長一段時間內對真實數據的執行情況。這個過程至少有兩個主要元素。

如何防止模型退化?

這聽起來可能很明顯,但是在部署之后監視ML性能非常重要。如果監視所有特征聽起來像一項耗時的任務,那么我們可以監視一些關鍵特征,這些特征的數據分布變化可能會嚴重影響模型結果。我強烈建議你在投入生產之前為這個過程創建一個策略(通過識別正確的元素)。

模型監控是一個持續的過程

如果你觀察到模型性能下降,那么是時候重新構造模型設計了。棘手的部分不是刷新模型和創建一個重新訓練的模型,而是考慮額外的特征,這些特征可能會提高模型的性能,使其更加可靠和準確。

完成上述步驟之后,就可以使用新的或修改過的一組特征和模型參數重新創建模型了。在這一點上,我們的目標是確定一個最優的模型,該模型能夠提供最佳的精度,這很好地概括了一些數據漂移。

我注意到,在某些情況下,模型的重新創建并不能提高模型的性能。在這些情況下,分析模型出錯的例子并尋找當前特征集之外的趨勢可以幫助識別新特征。基于這些知識創建新特征可以給模型提供新的學習經驗。

手工學習

我們經常使用新數據來維護模型的一個解決方案是,使用我們最初用于構建模型的相同流程來訓練和部署我們的模型。我們稱之為手工學習。你可以想象這個過程會很耗時。我們多久對模型進行一次再訓練?每周?每天嗎?答案取決于你的ML應用。

當我們手工對模型進行再訓練時,我們可能會發現一種新的算法或一組不同的特征,可以提高精確度。事實上,定期回顧你的處理過程可能是個好主意。正如我前面提到的,你可能會找到一種不同的算法或一組新的特征來改進你的預測,而這并不是連續學習系統所擅長的。

也許你可以每個月或者每年用之前收集的數據來更新模型。

這還可能涉及對模型進行反向測試,以便在重新擬合靜態模型時選擇適當數量的歷史數據。

給數據加權重

另一個解決方案可能是給數據加權重。事實上,有些算法允許你權衡輸入數據的重要性。

使用與數據年齡成反比的加權系統可能會很有趣,這樣會更多地關注最近的數據(權重更高),而較少關注最近的數據(權重更小)。

持續學習

我最喜歡的方法是擁有一個能夠持續評估和重新訓練模型的自動化系統。持續學習系統的好處是它可以完全自動化。

機器學習模型在生產中退化的原因

一般來說,合理的模型監控與周密的模型檢查計劃相結合,對于保持生產模型的準確性是至關重要的。對關鍵變量進行優先級檢查,并為發生更改時設置警告,這將確保你不會對環境的更改感到意外,而環境的更改會破壞你的模型的有效性。

對于數據點具有高度獨立性的輸入變量,可以使用統計過程控制中使用的控制圖來檢測過程的變化。

處理模型漂移

我堅持這一點,但你的ML成功也取決于你計劃如何維護你訓練有素的模型。在幾個項目中,我意識到缺乏模型工作經驗的商業領袖可能無法預料到這種需求。

一個產品化的模型包括監視和維護

應該定期評估新數據集上的模型性能。應該定期對這些性能跟蹤進行可視化和比較,以便您可以確定何時進行干預。有幾個度量ML性能的指標。

機器學習模型在生產中退化的原因

模型退化的原因可以被明確地發現和建模。可以研究、理解和利用周期性時間效應。一旦模型收集了足夠的性能指標,數據科學團隊就可以處理這個項目。假設你一直在跟蹤他們。

定期考慮性能指標并觸發重新訓練或重建模型的過程也是必要的,因為沒有它,你將能夠看到性能損失,但沒有適當的系統來解決它。

投入&團隊

除了技術方面,我強烈建議你在項目投入生產后,將最好的數據科學家和工程師留在項目中。與經典的軟件項目不同,在部署之后,你的操作團隊處理它,工程師繼續構建下一個大項目,ML和AI系統中的許多技術挑戰是保持它們的準確性。

你還需要投入資源,以保持你的客戶使用的機器學習產品和服務的準確性。這意味著與傳統軟件相比,ML產品的運營邊際成本更高。

維護成本

為了維護高質量的模型,應該在每次數據交付時對算法進行再訓練。另一方面,為了優化成本,應該盡可能少地去做。

顯然,某些機器學習開發實踐需要更多的技術債,因此需要比其他實踐更多的未來維護。特定于機器學習的發展債風險因素是多種多樣的。它們包括無數的概率變量、數據依賴、遞歸反饋循環、管道流程、配置設置,以及加劇機器學習算法性能不可預測性的其他因素。

這些復雜性越多,就越難以進行有效維護所需的根源分析。

你無法完全自動化地解決維護負擔。在任何情況下,傾向于機器學習模型都需要仔細檢查、批判性思維和手工工作,而這些只有受過高度訓練的數據科學家才能提供。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8500

    瀏覽量

    134471
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電機高效再制造在企業生產中的應用

    高效再制造在企業生產中的應用.pdf (免責聲明:本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!)
    發表于 04-07 17:31

    電子產品生產中的電路板布線設計

    電子產品的生產中,電路板布線設計和激光焊錫技術是兩個關鍵環節,直接影響產品的性能、可靠性和生產效率。
    的頭像 發表于 03-18 14:31 ?401次閱讀
    電子產品<b class='flag-5'>生產中</b>的電路板布線設計

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編將探討機器學習
    的頭像 發表于 02-13 09:39 ?351次閱讀

    AI自動化生產:深度學習在質量控制中的應用

    隨著科技的飛速發展,人工智能(AI)與深度學習技術正逐步滲透到各個行業,特別是在自動化生產中,其潛力與價值愈發凸顯。深度學習軟件不僅使人工和基于規則的算法難以勝任的大量生產任務得以自動
    的頭像 發表于 01-17 16:35 ?677次閱讀
    AI自動化<b class='flag-5'>生產</b>:深度<b class='flag-5'>學習</b>在質量控制中的應用

    測徑儀 測測長儀是如何應用在卷煙生產中的?

    關鍵字:卷煙測徑儀,卷煙測長儀,煙草測徑儀,煙草測長儀,煙草機械測徑儀,卷煙設備,煙草設備, 測徑儀和測長儀在卷煙生產中發揮著至關重要的作用,它們能夠精確測量卷煙的物理尺寸,確保產品質量的一致性
    發表于 11-13 13:58

    在生產中實施MES的步驟

    。以下是在生產中實施MES的一般步驟: 需求分析 : 確定MES的目標和預期效果。 分析現有生產流程,識別瓶頸和改進點。 確定MES需要支持的關鍵功能,如生產調度、質量控制、設備管理等。 項目規劃 : 制定詳細的項目實施計劃,包
    的頭像 發表于 10-27 09:21 ?917次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發表于 10-23 15:25 ?2846次閱讀

    AI大模型與傳統機器學習的區別

    AI大模型與傳統機器學習在多個方面存在顯著的區別。以下是對這些區別的介紹: 一、模型規模與復雜度 AI大模型 :通常包含數十億甚至數萬億的參
    的頭像 發表于 10-23 15:01 ?2530次閱讀

    在生產階段更新bq275xx固件

    電子發燒友網站提供《在生產階段更新bq275xx固件.pdf》資料免費下載
    發表于 10-17 10:29 ?0次下載
    <b class='flag-5'>在生產</b>階段更新bq275xx固件

    構建語音控制機器人 - 線性模型機器學習

    2024-07-31 |Annabel Ng 在該項目的[上一篇博客文章]中,我介紹了運行機器人電機、處理音頻信號和調節電壓所需的電路的基礎知識。然而,機器人還沒有完全完成!盡管機器人可以正確移動
    的頭像 發表于 10-02 16:31 ?550次閱讀
    構建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    在生產制造業中,碼垛機器人發揮的重要作用

    ?在生產制造業中,碼垛機器人發揮著至關重要的作用,主要體現在以下幾個方面: ?一、題高生產效率 ?碼垛機器人能夠以很高的速度和精度進行碼垛作業,遠遠超過人工碼垛的效率。它可以持續不間斷
    的頭像 發表于 09-02 15:51 ?409次閱讀

    現代化農業生產中,立柱機器人不同規格肥料碼垛

    在現代化農業生產中,立柱機器人被應用于不同規格肥料的碼垛作業,其效高、準確、靈活的特點為農業生產帶來了顯著的變革。以下是對立柱機器人在不同規格肥料碼垛中的具體應用的詳細分析: 一、立柱
    的頭像 發表于 08-26 15:08 ?438次閱讀
    現代化農業<b class='flag-5'>生產中</b>,立柱<b class='flag-5'>機器</b>人不同規格肥料碼垛

    關于SMT貼片生產中導致拋料原因分析

    一站式PCBA智造廠家今天為大家講講SMT加工中造成拋料率高的原因有哪些?SMT加工拋料率高的原因。SMT工廠中高拋料率可能由多種原因引起,拋料是指在生產過程中未能成功安裝到PCB上的
    的頭像 發表于 08-14 09:23 ?733次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    今天來學習大語言模型在自然語言理解方面的原理以及問答回復實現。 主要是基于深度學習和自然語言處理技術。 大語言模型涉及以下幾個過程: 數據收集:大語言
    發表于 08-02 11:03

    pycharm如何訓練機器學習模型

    PyCharm是一個流行的Python集成開發環境(IDE),它提供了豐富的功能,包括代碼編輯、調試、測試等。在本文中,我們將介紹如何在PyCharm中訓練機器學習模型。 一、安裝PyCharm
    的頭像 發表于 07-11 10:14 ?1681次閱讀
    主站蜘蛛池模板: 清原| 利川市| 沙雅县| 万州区| 余庆县| 磐石市| 江永县| 平阴县| 普陀区| 东明县| 如东县| 安图县| 鹤庆县| 云龙县| 安福县| 屯留县| 南召县| 淮南市| 宁波市| 东丰县| 岑巩县| 沙坪坝区| 乌鲁木齐县| 新兴县| 嘉义县| 五指山市| 沾益县| 浑源县| 土默特右旗| 平果县| 靖安县| 沁源县| 平谷区| 虎林市| 静宁县| 普格县| 漯河市| 安乡县| 汉中市| 酉阳| 清水县|