基于Bagging決策樹優(yōu)化算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)經(jīng)典C4.5決策樹算法存在過度擬合和伸縮性差的問題,提出了一種基于Bagging的決策樹改進(jìn)算法,并基于MapReduce模型對(duì)改進(jìn)算法進(jìn)行了并行化。首先,基于Bagging技術(shù)對(duì)C4.5算法進(jìn)行了改進(jìn),通過有放回采樣得到多個(gè)與初始訓(xùn)練集大小相等的新訓(xùn)練集,并在每個(gè)訓(xùn)練集上進(jìn)行訓(xùn)練,得到多個(gè)分類器,再根據(jù)多數(shù)投票規(guī)則集成訓(xùn)練結(jié)果得到最終的分類器;然后,基于MapReduce模型對(duì)改進(jìn)算法進(jìn)行了并行化,能夠并行化處理訓(xùn)練集、并行選擇最佳分割屬性和最佳分割點(diǎn),以及并行生成子節(jié)點(diǎn),實(shí)現(xiàn)了基于MapReduce Job工作流的并行決策樹改進(jìn)算法,提高了對(duì)大數(shù)據(jù)集的分析能力。實(shí)驗(yàn)結(jié)果表明,并行Bagging決策樹改進(jìn)算法具有較高的準(zhǔn)確度與敏感度,以及較好的伸縮性和加速比。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于Bagging決策樹優(yōu)化算法下載
相關(guān)電子資料下載
- 深入探討機(jī)器學(xué)習(xí)的可視化技術(shù) 191
- 深度解析機(jī)器學(xué)習(xí)各大模型原理 1144
- 什么是隨機(jī)森林?隨機(jī)森林的工作原理 1851
- 機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)全攻略 126
- 決策樹:技術(shù)全解與案例實(shí)戰(zhàn) 762
- 一種基于決策樹的飛機(jī)級(jí)故障診斷建模方法研究 739
- 基于粗糙集聯(lián)合決策樹法的智能變電站遠(yuǎn)程調(diào)度管理優(yōu)化 392
- 數(shù)據(jù)挖掘十大算法 2071
- 常見的機(jī)器學(xué)習(xí)算法及其應(yīng)用場(chǎng)景 622
- 為什么GBDT用回歸樹不用分類樹?CART決策樹是怎么計(jì)算基尼值呢? 1396