女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于代碼的機器學習是什么,它的原理如何

獨愛72H ? 來源:CDA數據分析師 ? 作者:CDA數據分析師 ? 2020-03-20 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:CDA數據分析師)

隨著IT組織的發展,其代碼庫的大小以及開發人員工具鏈的復雜性也在不斷增長。工程負責人對其代碼庫,軟件開發過程和團隊狀態了解的非常有限。通過將現代數據科學和機器學習技術應用于軟件開發,大型企業有機會顯著提高其軟件交付性能和工程效率。

在過去的幾年中,許多大型公司,例如Google,Microsoft,Facebook以及類似Jetbrains等較小的公司已經與學術研究人員合作,為基于代碼的機器學習奠定了基礎。

基于代碼的機器學習是什么,它的原理如何

基于代碼的機器學習?代碼機器學習(MLonCode)是一個新的跨學科研究領域,涉及自然語言處理,編程語言結構以及社會和歷史分析,例如貢獻圖形和提交時間序列。MLonCode旨在從大規模的源代碼數據集中學習,從而能自動執行軟件工程任務,例如輔助代碼審查,代碼重復數據刪除,軟件專業知識評估等。

為什么MLonCode很難?某些MLonCode問題要求零錯誤率,例如與代碼生成有關的錯誤率。自動程序修復是一個特定的示例。一個微小的單一錯誤預測可能會導致整個程序的編譯失敗。

在其他一些情況下,錯誤率必須足夠低。理想的模型應犯的錯誤應盡可能少,所以用戶(軟件開發人員)的信噪比仍是可承受且值得信賴的。因此,可以使用與傳統靜態代碼分析工具相同的方式來使用該模型。最佳實踐挖掘就是一個很好的例子。

最后,絕大多數MLonCode問題是無監督的,或至多是弱監督的。手動標記數據集可能會非常昂貴,因此研究人員通常必須開發相關的啟發式方法。例如,有許多相似性分組任務,例如向相似的開發人員展示或根據專業領域幫助團隊。我們在本主題中的經驗在于挖掘代碼格式化規則,并將其應用于修復錯誤,這與短絨一樣,但完全不受監督。有一個相關的學術競賽來預測格式問題,稱為CodRep。

基于代碼的機器學習是什么,它的原理如何

MLonCode問題包括各種數據挖掘任務,這些任務從理論上講可能是微不足道的,但由于規模或對細節的關注,在技術上仍然具有挑戰性。示例包括代碼克隆檢測和類似的開發人員聚類。此類問題的解決方案在年度學術會議“ 采礦軟件存儲庫”中進行了介紹。

采礦軟件存儲庫會議徽標。解決MLonCode問題時,通常用以下方式之一表示源代碼:頻率字典(加權詞袋,BOW)。示例:函數內的標志符;文件中的graphlet;存儲庫的依賴性;可以通過TF-IDF加權頻率等。這些表示是最簡單,可伸縮性最高的。順序令牌流(TS),對應于源代碼解析序列。該流通常通過指向相應抽象語法樹節點的鏈接來增強。此表示形式對常規自然語言處理算法(包括序列到序列深度學習模型)很友好。

一棵樹,它自然地來自抽象語法樹。在進行不可逆的簡化或標志符后,我們執行各種轉換。這是最強大的表示形式,也是最難使用的表示形式。以下是相關的ML模型包括各種圖嵌入和門控圖神經網絡

解決MLonCode問題的許多方法都基于所謂的自然假說(Hindle等):“從理論上講,編程語言是復雜,靈活且功能強大的,但很多人實際上編寫的程序大多是簡單且相當重復的,因此它們具有有用的可預測統計屬性,可以在統計語言模型中捕獲并用于軟件工程、任務。”

該聲明證明了大代碼的有用性:分析的源代碼越多,強調的統計屬性越強,并且訓練有素的機器學習模型所獲得的指標越好。底層關系與當前最新的自然語言處理模型相同:如XLNet,ULMFiT等。類似地,通用MLonCode模型可以在下游任務中進行訓練和利用。
(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 代碼
    +關注

    關注

    30

    文章

    4892

    瀏覽量

    70428
  • 機器學習
    +關注

    關注

    66

    文章

    8499

    瀏覽量

    134303
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統機器
    的頭像 發表于 12-30 09:16 ?1112次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?424次閱讀

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學領域的一個分支,致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習(Machine
    的頭像 發表于 12-05 15:21 ?1882次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得逐漸成為智能數據分析技術的創新源之一,
    的頭像 發表于 11-16 01:07 ?928次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發表于 11-15 09:19 ?1138次閱讀

    具身智能與機器學習的關系

    (如機器人、虛擬代理等)通過與物理世界或虛擬環境的交互來獲得、發展和應用智能的能力。這種智能不僅包括認知和推理能力,還包括感知、運動控制和環境適應能力。具身智能強調智能體的身體和環境在智能發展中的重要性。 2. 機器學習的定義
    的頭像 發表于 10-27 10:33 ?989次閱讀

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務。 特征工程(Feature Engineering)是將數據轉換為更好地表示潛在問題的特征,從而提高機器學習
    發表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    之前對《時間序列與機器學習》一書進行了整體瀏覽,并且非常輕松愉快的完成了第一章的學習,今天開始學習第二章“時間序列的信息提取”。 先粗略的翻閱第二章,內容復雜,充斥了大量的定義、推導計
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    這本書不僅內容豐富,而且當我打開時,它還帶有一種特殊的含義--頁面上的簽名來自一次溫暖的社區活動。這些簽名充當了作者、讀者和整個學習社區之間的紐帶,見證了知識的轉移和成長的樂趣。 本書目錄結構
    發表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時
    發表于 08-11 17:55

    pycharm如何訓練機器學習模型

    PyCharm是一個流行的Python集成開發環境(IDE),提供了豐富的功能,包括代碼編輯、調試、測試等。在本文中,我們將介紹如何在PyCharm中訓練機器學習模型。 一、安裝Py
    的頭像 發表于 07-11 10:14 ?1629次閱讀

    機器學習中的數據分割方法

    機器學習中,數據分割是一項至關重要的任務,直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據分
    的頭像 發表于 07-10 16:10 ?3080次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?2257次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?2354次閱讀
    主站蜘蛛池模板: 郧西县| 武山县| 德令哈市| 朔州市| 阜阳市| 开鲁县| 大荔县| 贺州市| 会宁县| 凤冈县| 抚松县| 新龙县| 咸阳市| 齐齐哈尔市| 宁河县| 驻马店市| 乌兰县| 银川市| 布尔津县| 广饶县| 剑阁县| 垣曲县| 津市市| 革吉县| 五大连池市| 汶上县| 广宁县| 屏东县| 高碑店市| 南宁市| 南乐县| 高州市| 扶风县| 镇远县| 竹北市| 彰化市| 拉萨市| 成都市| 合川市| 南部县| 孟津县|