淺談DeepLabV3\U2Net\HRNet-seg模型的圖像分割調優

01 ? ? ? 序

很久沒有寫過博客了，最近忙于做項目，閉了后簡單寫一下心得體會。近期主要是在做服飾場景相關的項目，今天簡單寫寫其中做的一個服飾分割。

初版代碼已經提交，歡迎大家提issue和pr

https://github.com/FlyEgle/segmentationlight

02 ? ? ? 背景

主要場景就是對模特進行服飾摳圖，要求邊緣處理相對平滑，扣取召回和準確率比較高，能夠覆蓋95%以上的場景case。同時需要考慮模型FLOPs以及結構便宜性，便于后期有壓縮的需求。

03 ? ? ? 模型選擇

有考慮過如下三種模型：

DeepLabV3

U2Net

HRNet-seg

這里DeepLabV3有空洞卷積存在，對于細致的扣圖，效果不是很好，更加適用于連通性比較強的物體分割以及多類別分割。

HRNet-seg存在一個問題，最后輸出的featuremap分別是[1/4, 1/8, 1/16, 1/32]，雖然是有不斷的高低分辨率的交互，但是1/4還是有點捉襟見肘，會影響一些小的pixel，空洞以及邊緣效果。所以做了簡單的修該如下：

FPN+upsmaple形式

FPN+upsample

upsmaple+cat

upsmaple+cat 相對來說FPN的收斂速度會更快一些，計算量更小，性能略高，相比原始HRseg的輸出來說，細致化了很多。 3. U2net的計算量要比HRnet-fpn更小，同時，U2net更加注重刻畫細節。由于場景只有一個類別，所以U2Net不太需要考慮類別的關系，對于模型本身來說更加適配。 4. 有嘗試過修改U2net，包括增加attention，增加refine Module，多監督約束以及修改結構等，不過最終都比較雞肋了，寫paper還是可以的，從實際case效果上看幾乎無差。也嘗試過x2，x4channel，性能上也沒明顯提升。不過對于專一場景來說，模型本身不是重點。

u2net模型結構

04 ? ? ? 損失設計

任務只要求區分前景和背景，自然可以理解為二分類或者是1分類問題，所以基礎loss的選擇就可以是softmax+CE(二分類)，sigmoid+bce(前景)。sigmoid相比softmax對于邊緣效果更佳友好(可以調節閾值)，為了保證連通區域，采用了bce+3*dice作為baseline損失。這里在320x320尺寸下，做了一些對比實驗，可以看到bce+iou指標最高，不過case by case的話視覺效果沒有bce+dice好。降低dice的系數，也是因為有時候dice過強忽略了bce判別正負樣本的情況。

損失函數也嘗試過一些其他的loss，如focalloss，tv， L1等損失組合，意義不是很大，代碼如下：

# ----------------- DICE Loss--------------------class DiceLoss(nn.Module):
    def __init__(self):
        super(DiceLoss, self).__init__()
 
    def forward(self, logits, targets, mask=False):
        num = targets.size(0)
        smooth = 1.


        probs = torch.sigmoid(logits)
        m1 = probs.view(num, -1)
        m2 = targets.view(num, -1)
        intersection = (m1 * m2)
 
        score = 2. * (intersection.sum(1) + smooth) / (m1.sum(1) + m2.sum(1) + smooth)
        score = 1 - score.sum() / num
        return score# -------------------- BCELoss -----------------------class BCELoss(nn.Module):
    """binary bceloss with sigmoid"""
    def __init__(self):
        super(BCELoss, self).__init__()


    def forward(self, inputs, targets, weights=None, mask=False):
        assert len(inputs.shape) == 4, "inputs shape must be NCHW"
        if len(targets.shape) != 4:
            targets = targets.unsqueeze(1).float()
        else:
            targets = targets.float()
        if mask:
            inputs  = inputs * targets
        losses = F.binary_cross_entropy_with_logits(inputs, targets, weights)
        return losses# ----------------- DICE+BCE Loss--------------------class DiceWithBCELoss(nn.Module):
    def __init__(self, weights, mining=False):
        super(DiceWithBCELoss, self).__init__()
        self.dice_loss = DiceLoss()
        if mining:
            self.bce_loss = BalanceCrossEntropyLoss() 
        else:
            self.bce_loss = BCELoss()
        self.weights = weights


    def forward(self, preds, targets):
        bceloss = self.bce_loss(preds, targets)
        diceloss = self.dice_loss(preds, targets)
????????return?self.weights['bce']?*?bceloss?+?self.weights['dice']*diceloss

05 ? ? ? 訓練優化

1. 分辨率

baseline模型的訓練尺寸為320x320，隨之提升到了640x640，這里采用兩種方法，一個是from strach訓練一個是load 320的pretrain 進行訓練。相比于strach，pretrain的效果會更好，隨著數據的迭代和累積，不斷的采用上一個最好效果的weights來做下一次訓練模型的pretrain，最終訓練尺寸為800x800。嘗試過采用更大的分辨率960和1024來進行訓練，在個人的場景上基本沒有顯著提升。（ps: 1024尺寸下的bs太小了，加了accumulate grad后性能下降的明顯）

2. 數據增強

數據增強采用基本都是常規的，隨機crop，隨機翻轉，隨機旋轉，隨機blur，這里colorjitter會影響性能就沒有用了。

def build_transformers(crop_size=(320, 320)):
    if isinstance(crop_size, int):
        crop_size = (crop_size, crop_size)
    
    data_aug = [
        # RandomCropScale(scale_size=crop_size, scale=(0.4, 1.0)),
        RandomCropScale2(scale_size=crop_size, scale=(0.3, 1.2), prob=0.5),
        RandomHorizionFlip(p=0.5),
        RandomRotate(degree=15, mode=0),
        RandomGaussianBlur(p=0.2),
    ]


    to_tensor = [
        Normalize(normalize=True, mean=IMAGENET_DEFAULT_MEAN, std=IMAGENET_DEFAULT_STD),
        ToTensor(channel_first=True)
    ]


    final_aug = data_aug + to_tensor
    return Compose(final_aug)

比較重要的一點的是randomcrop，調整了crop的區域為[0.3,1.2]，一方面是因為crop區域太小，容易忽視整體性，另一方面是crop大一些可以相應的對應大分辨率。要注意的是，crop的區域是需要包含前景，可以通過設定前景占比來進行調整，也可以理解為手動balance數據。

class RandomCropScale2:
    """RandomCrop with Scale the images & targets, if not crop fit size, need to switch the prob to do reisze to keep the over figure        scale_size :  (list) a sequence of scale        scale      :  default is (0.08, 1.0),  crop region areas        ratio      :  default is (3. / 4., 4. / 3.), ratio for width / height    Returns:        scale_image : (ndarray) crop and scale image        scale_target: (ndarray) crop and scale target, shape  is same with image    """
    def __init__(self, scale_size, scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.), prob=0.5):
        self.scale_size = scale_size
        self.scale = scale 
        self.ratio = ratio   


        # self.prob = np.random.uniform(0, 1) > prob
        self.prob = prob
        self.scale_func = Scale(self.scale_size)

        # center crop
        # self.centercrop = CenterCrop(self.scale_size)

        if (self.scale[0] > self.scale[1]) or (self.ratio[0] >  self.ratio[1]):
            warnings.warn("Scale and ratio  should be of kind (min, max)")

    def _isBG(self, tgts):
        """If the targets all is 0, 0 is background        """
        if np.sum(tgts) == 0:
            return True 
        else:
            return False

    # TODO: fix empty bug
    def _crop_imgs(self, imgs, tgts):
        height, width, _ = imgs.shape 
        area =  height * width 


        for _ in range(10):
            target_area = area * np.random.uniform(self.scale[0], self.scale[1])
            aspect_ratio = np.random.uniform(self.ratio[0], self.ratio[1])


            w = int(round(math.sqrt(target_area * aspect_ratio)))
            h = int(round(math.sqrt(target_area / aspect_ratio)))


            if 0 < w < width and 0 < h < height:
                random_y = np.random.randint(0, height - h + 1)
                random_x = np.random.randint(0, width - w + 1)
                
                crop_image = imgs[random_y:random_y+h, random_x:random_x+w]
                crop_target = tgts[random_y:random_y+h, random_x:random_x+w]


                if not self._isBG(crop_target):
                    crop_image, crop_target = self.scale_func(crop_image, crop_target)
                    return crop_image, crop_target

            # switch prob or center crop
            if np.random.uniform(0, 1) > self.prob:
                # center crop
                in_ratio = float(width) / float(height)
                if in_ratio < min(self.ratio):
                    w = width
                    h = int(round(w / min(self.ratio)))
                elif in_ratio > max(self.ratio):
                    h = height
                    w = int(round(h * max(self.ratio)))
                else:
                    w = width
                    h = height 
                
                # navie center crop
                crop_x = max((width - w) // 2, 0)
                crop_y = max((height  - h) // 2, 0)
                imgs = imgs[crop_y:crop_y+height,  crop_x:crop_x+width]
                tgts = tgts[crop_y:crop_y+height, crop_x:crop_x+width]

            # scale 
            crop_image, crop_target = self.scale_func(imgs, tgts)
            return crop_image, crop_target


    def __call__(self, imgs, tgts):
        crop_image, crop_target = self._crop_imgs(imgs, tgts)
????????return?crop_image,?crop_target

3. 數據

這個就仁者見仁智者見智了，查缺補漏就好，一般新數據，我會用模型過濾一遍，卡個0.98或者0.99的miou，小于這個閾值的用于訓練，大于閾值的采樣訓練。訓練這里采用的是ADAMW優化器，1e-2的weights decay，5e-4到1e-4調整學習率，視情況而定。（ADAMW偶爾會出現nan的問題，要查找是否數據有nan，如果沒有大概率是因為有bn導致的數值溢出，可以調小LR或者更換優化器）采用了CircleLR進行衰減，效果還算ok，跑相同300個epoch，比CosineLR要好一點點。最終場景驗證數據可以到達99%+的miou。

06 ? ? ? 邊緣優化

Sigmoid訓練后，可以簡單的卡個閾值來進行邊緣平滑處理，可以二值也可以過渡。

output[output >= thre] = 1 or None
output[output < thre] = 0

邊緣

粗看邊緣還算可以，但是細看就發現鋸齒很明顯了，還需要進一步處理，這里簡單做了一個算法，縮放現有的mask（這里縮放可以用contour，也可以用腐蝕，也可以用shapely），把原始圖像做blur，把外圈的blur貼回來。

def edgePostProcess(mask, image):
    """Edge post Process    Args:        
mask: a ndarray map, value is [0,255], shape is (h, w, 3)   
     image: a ndarray map, value is 0-255, shape  is(h, w, 3)  
  Returns:     
   outputs: edge blur image    """
    mask[mask==255] = 1
    mask = getShrink(mask)

    image = image * mask 
    image[image==0] = 255
    blur_image = cv2.GaussianBlur(image, (5, 5), 0)
    new_mask = np.zeros(image.shape, np.uint8)
    contours, hierachy = cv2.findContours(
        mask[:,:,0],
        cv2.RETR_EXTERNAL,
        cv2.CHAIN_APPROX_SIMPLE
    )
    cv2.drawContours(new_mask, contours, -1, (255, 255, 255), 5)
    output = np.where(new_mask==np.array([255, 255, 255]), blur_image, image)
    return output

邊緣其實可以看到，邊緣只是blur了，但是貼到白背景上可以發現視覺效果會好很多，這也是欺騙人眼的一個方法。放一張高圓圓的照片吧，看一下分割后的結果

07 ? ? ? 代碼

這套代碼框架寫了個把個月，包括了FCNs，SegNets，DeepLab，UNet，U2Net，HRNet等一些常用模型的實現，loss，aug，lrshedule等，以及VOC上的一些pretrain。整體代碼簡單明了，模塊分明，如果有需要后面可以考慮開源。

model zoo 最后，本人不是主要做分割的，只是項目需要了就寫了一套代碼框架，做了一些相關的實驗探索，有一定的場景調優，不一定具備共性，歡迎大家討論~

編輯：黃飛

閱讀全文

圖像分割(17844) 圖像分割(17844)

使用LabVIEW實現基于pytorch的DeepLabv3圖像語義分割

使用LabVIEW實現deeplabV3語義分割

2023-03-22 15:06:52

1253

使用LabVIEW實現 DeepLabv3+ 語義分割含源碼

使用LabVIEW實現 DeepLabv3+ 語義分割含源碼

2023-05-26 10:23:01

522

圖像分割

`哪位大神知道圖像分割如何做，如圖中如何將中間的那一個部分提取出來`

2017-05-04 21:46:30

圖像分割不能運行

我正在做labview的圖像處理，其中有一步是要求進行圖像分割，但我編完程序之后老是卡掉，運行不了，求大神幫我看看哪里出錯了。

2013-05-21 10:00:03

圖像處理算法介紹：閾值分割

對于直方圖雙峰不明顯，或圖像目標和背景比例差異懸殊，迭代法所選取的閾值不如最大類間方差法。3、直方圖凹面分析法方法對某些只有單峰直方圖的圖像，可以作出分割。從直觀上說，圖像直方圖雙峰之間的谷底，應該是

2016-04-27 14:22:58

HBase性能調優概述

HBase性能調優

2019-07-03 11:35:56

KeenTune的算法之心——KeenOpt 調優算法框架 | 龍蜥技術

了不同的道路。（圖1/條條調優路）對于機器學習模型超參數調優來說，調優的時間開銷主要來自兩個方面：（1）調優算法搜索策略所需要的運算耗時。（2）機器學習模型訓練的耗時。對于近年來逐漸廣為人知的基于高保真

2022-10-28 10:36:50

flume讀取文件延遲調優說明

flume讀取文件延遲調優

2020-07-17 16:38:06

van-自然和醫學圖像的深度語義分割：網絡結構

概率值最大的分割結果，作為最后的分割圖。U-Net中常常會問為什么適用于醫學圖像這個問題.。首先分析醫學影像數據特點：圖像語義較為簡單，結構較為固定：都是一個固定的器官的成像。而且器官本身結構固定

2021-12-28 11:03:35

van-自然和醫學圖像的深度語義分割：網絡結構

2021-12-28 11:06:01

【Firefly RK3399試用體驗】之三——基于閾值的圖像分割

本帖最后由 1413909 于 2017-7-6 20:30 編輯在圖像處理中，有一個很重要的部分就是圖像分割，這也是機器視覺中對圖像做的最基礎的處理，圖像分割的方法有基于閾值的圖像分割

2017-07-06 20:30:30

一種基于Deep U-Net的多任務學習框架

參考的。多任務U-Net圖像分割多任務深度U-Net是在二維U-Net基礎上發展而來的。數據集的圖像在x-y平面上的最大尺寸為640 × 640，通過增加池化層來增加U-Net的接收域。它由5個下采樣塊和5個上

2022-11-10 15:35:57

一種新的粘連字符圖像分割方法

損傷，影響后期識別。參考文獻[2]采用了輪廓分裂與區域合并相結合的算法，能夠分割粘連字符，但過程復雜且準確率不高，抗干擾性一般。參考文獻[3]提出了一種基于骨架形態分析的粘連分割算法,但該方法利用閾值

2009-09-19 09:19:17

使用全卷積網絡模型實現圖像分割

OpenCv-C++-深度神經網絡（DNN）模塊-使用FCN模型實現圖像分割

2019-05-28 07:33:35

功耗調優時經常用到的幾個方法

前言不清楚當前產品的整機功耗，就不清楚怎么調優獲取產品的整機及各個模塊的功耗數據，需要測量正確的功耗測量方法，快速的了解整機的功耗分布，為功耗調優提供方向。功耗測量功耗拆解，是功耗調優的前提，需要

2021-12-21 06:31:28

印刷電路板的圖像分割

自適應閾值分割算法：　　（1）將圖像分成4個子圖像；　　（2）計算每個字圖像的均值；　　（3）根據均值設置閾值，閾值只應用在對應的子圖像；　　（4）根據閾值，對每個子塊進行分割。　　此算法中，將均值作為子

2018-08-29 10:53:08

基于GAC模型實現交互式圖像分割的改進算法

的基于GAC模型的交互式圖像分割算法可以描述如下：　　(1)預處理。采用TV_L1模型對圖像進行平滑(取λ=0.5)。　　(2)用8鄰點差分格式計算梯度和圖像等照度線的曲率: 　　(3)按照

2009-09-19 09:19:45

基于MLP的快速醫學圖像分割網絡UNeXt相關資料分享

1、基于MLP的快速醫學圖像分割網絡UNeXt　　方法概述　　之前我們解讀過基于 Transformer 的 U-Net變體，近年來一直是領先的醫學圖像分割方法，但是參數量往往不樂觀，計算復雜，推理

2022-09-23 14:53:05

基于改進遺傳算法的圖像分割方法

基于改進遺傳算法的圖像分割方法提出一種應用于圖像分割的改進遺傳算法,算法中引入了優生算子、改進的變異算子和新個體,避免了局部早熟,提高了收斂速度和全局收斂能力。　　關鍵詞: 圖像分割&

2009-09-19 09:36:47

智能車競賽淺談——圖像篇

u16 time_out=0;if(mt9v03x_finish_flag) {Get_Use_Image();// 取出賽道及顯示所需圖像數據Get_Bin_Image(3

2022-09-24 15:05:15

深度學習在醫學圖像分割與病變識別中的應用實戰

U-Net網絡結構 def unet(input_shape): inputs = Input(input_shape) # 編碼器部分 conv1 = Conv2D(32, (3, 3

2023-09-04 11:11:23

基于向量流場節點的圖像分割算法

人工干預使蛇模型只能用于半自動的圖像分割，該文在梯度向量流(GVF)蛇模型的基礎上提出一種基于流場節點與最小路徑方法的全自動圖像分割算法。在圖像的GVF 場上檢測出流場節

2009-03-25 08:53:38

基于多級混合模型的圖像分割方法

本文研究了典型的基于區域的圖像分割方法主動形狀模型（Active Shape Model, ASM）和基于邊緣的圖像分割snake 算法，分析了算法適用條件和各自的優缺點。結合snake 模型與主動形狀模型

2009-07-08 09:58:09

基于方向氣球力活動輪廓模型的圖像分割

針對傳統參數活動輪廓模型存在對輪廓線初始位置敏感的缺點，提出了方向氣球力活動輪廓模型并應用于MRI 圖像分割。該模型利用底層圖像分割的結果確定外力的方向，使氣球力方

2009-07-15 10:51:34

基于C-V 的壓力模型對飛機紅外圖像分割

針對飛機紅外圖像中存在的背景噪聲大、目標幾何結構復雜、圖像對比度低所造成參數活動輪廓模型進行圖像分割的困難，本文利用獲得的各區域灰度信息，進行Chen-Vese 能量函數最

2009-08-05 15:01:11

圖像的亮度矩和閾值分割

圖像的亮度矩和閾值分割:簡要介紹圖像的亮度矩以及在保持圖像亮度矩不變的條件下對圖像進行兩級閹值分割的方法，并對這種方法得到的方程組采用最小=乘法進行求解，以減小噪

2009-10-26 11:22:45

基于改進的活動輪廓模型在圖像分割中的應用

活動輪廓模型在圖像分割過程中有廣泛應用。本文首先介紹了活動輪廓模型，并指出了該模型的缺陷，在此基礎上本文提出了一種改進的方法，與現在流行的改進方法不同之處為

2009-12-12 11:44:11

基于C-V的壓力模型對飛機紅外圖像分割

2009-12-30 15:05:46

基于MAR-MRF的SAR圖像分割方法

該文提出了一種基于多尺度自回歸模型和馬爾科夫隨機場的SAR 圖像分割算法。算法引入多尺度自回歸模型，建立層與層之間以及相鄰層的像素點之間的數學關系，并將此模型與馬爾

2010-02-10 13:51:20

水平集方法在肝臟CT圖像分割中的應用

本文從理論上分析了無需重新初始化的水平集方法的主動輪廓圖像分割模型,此模型有很大的優越性,但對于目標與背景對比度較小這種情況不能得到一個好的分割效果。該模型應用于

2010-02-21 14:32:53

基于閾值法在圖像分割技術中的應用

基于閾值法在圖像分割技術中的應用圖像的研究和應用中，人們往往僅對圖像中的某些部分感興趣，這些部分稱為目標或前景(其他部分稱為背景)，他們一般對應圖像中特

2010-04-21 10:22:15

1174

PCB缺陷檢測中圖像分割算法

圖像分割在圖像處理中占有重要的地位，分割結果的好壞直接影響圖像的后續處理。本文介紹了4種常用的圖像分割方法及其在PCB缺陷檢測中的應用，并且利用實際的分割效果對4種分割

2011-06-16 15:31:29

基于多通道Gabor小波濾波器的圖像分割研究

本文討論了目前基于Gabor濾波器的多通道方法應用于圖像分割的現狀，給出了Gabor濾波器進行圖像分割的原理、過程、實驗結果及分析。介紹了圖像邊緣檢測、圖像閾值分割的各種算法，

2012-05-04 14:29:16

淺談圖像閾值分割技術

圖像分割是一種關鍵的圖像技術，在理論研究和實際應用中都得到了人們的廣泛重視。圖像分割的方法和種類有很多，有些分割運算可直接應用于任何圖像，而另一些只能適用于特殊類

2013-01-08 16:11:19

基于交叉視覺皮質模型的圖像快速分割新算法

為了使光學圖像分割處理達到實時性標準，本文引入了具有生物學背景的交叉視覺皮質模型用于圖像分割。在不降低分割效果的前提下，將交叉視覺皮質模型的閾值衰減函數調整為線性

2013-05-15 11:08:46

圖像分割—基于圖的圖像分割

圖像分割—基于圖的圖像分割圖像分割—基于圖的圖像分割

2015-11-19 16:17:11

基于Matlab圖像分割的研究

圖像分割在圖像處理過渡到圖像分析這個過程中起著非常重要的作用，它是圖像工程的核心，圖像分割的研究具有重要的理論和應用價值。介紹了圖像分割的基本理論和常用方法，借助Matlab平臺對閾值的分割、區域

2016-01-04 15:10:49

基于改進活動輪廓模型的圖像分割

基于改進活動輪廓模型的圖像分割_王芳

2017-01-07 19:00:39

串并行分割法在分形圖像壓縮的應用_段軍

2017-03-19 11:28:16

基于SOPC技術的圖像分割系統設計張學東

基于SOPC技術的圖像分割系統設計_張學東

2017-03-17 08:00:00

Tsallis熵的參數在圖像閾值分割中的應用_宋亞玲

2017-03-19 18:58:37

基于多尺度局部特征的圖像分割模型_李軍

2017-03-19 19:19:35

基于二次圖像分割的目標提取算法

圖像分割技術研究，指依據圖像的一些特性（如灰度強度、顏色、紋理等）將網像中的各個像素歸類成互相都不相交的、具有某種相似性的均勻子區域的過程，是圖像處理領域中的一項重要內容。本文根據分割方法的不同特點

2017-11-07 14:05:41

結合動態亮度的活動輪廓模型分割相似圖像組

，是能較好地分割目標特征缺失或錯誤的相似圖像組的一種活動輪廓模型，但其對于局部灰度不均的相似圖像組分割效果較差對此，本文提出了包含演化曲線內外的動態亮度信息的改進的ACGS模型。在全局信息的基礎上引入曲線

2017-11-09 15:47:05

基于紋理幾何結構的紋理描述圖像分割

偏置場變分水平集圖像分割模型利用原始圖像的局部灰度信息，可以對灰度不均勻圖像進行有效的分割，但當灰度圖像中存在紋理時，分割效果往往很差。針對這一問題，提出抑制紋理信息的偏置場變分水平集圖像分割模型

2017-11-22 17:29:13

opencv的圖像分割與融合技術

圖像閾值化分割是一種傳統的最常用的圖像分割方法，因其實現簡單、計算量小、性能較穩定而成為圖像分割中最基本和應用最廣泛的分割技術。它特別適用于目標和背景占據不同灰度級范圍的圖像。它不僅可以極大的壓縮

2017-12-04 15:04:16

10060

基于改進空間約束貝葉斯網絡模型的圖像分割

針對馬爾可夫鏈蒙特卡羅方法普遍存在的迭代收斂性問題，在具有空間平滑約束的高斯混合模型條件上提出改進空間約束貝葉斯網絡模型并在圖像分割領域進行具體應用。所提模型應用隱狄利克雷分布（ LDA）概率密度

2017-12-05 17:55:55

基于像素聚類進行圖像分割的算法

B型心臟超聲圖像分割是計算心功能參數前重要的一步。針對超聲圖像的低分辨率影響分割精度及基于模型的分割算法需要大樣本訓練集的問題，結合B型心臟超聲圖像的先驗知識，提出了一種基于像素聚類進行圖像分割

2017-12-06 16:44:11

圖像分割基礎算法及實現實例

圖像分割就是把圖像分成若干個特定的、具有獨特性質的區域并提出感興趣目標的技術和過程。它是由圖像處理到圖像分析的關鍵步驟。現有的圖像分割方法主要分以下幾類：基于閾值的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。

2017-12-18 18:19:33

9051

圖像分割評價方法研究

　閥值分割法是一種傳統的圖像分割方法，因其實現簡單、計算量小、性能較穩定而成為圖像分割中最基本和應用最廣泛的分割技術。閥值分割法的基本原理是通過設定不同的特征閥值，把圖像像素點分為具有不同灰度級

2017-12-19 09:13:13

30496

圖像分割和圖像邊緣檢測

　圖像分割的研究多年來一直受到人們的高度重視，至今提出了各種類型的分割算法。Pal把圖像分割算法分成了6類：閾值分割，像素分割、深度圖像分割、彩色圖像分割，邊緣檢測和基于模糊集的方法。但是，該方法

2017-12-19 09:29:38

10131

圖像分割技術的原理及應用

圖像分割至今尚無通用的自身理論。隨著各學科許多新理論和新方法的提出，出現了許多與一些特定理論、方法相結合的圖像分割方法。特征空間聚類法進行圖像分割是將圖像空間中的像素用對應的特征空間點表示，根據它們在特征空間的聚集對特征空間進行分割

2017-12-19 15:00:30

40226

圖像分割的基本方法解析

本文詳細介紹了圖像分割的基本方法有：基于邊緣的圖像分割方法、閾值分割方法、區域分割方法、基于圖論的分割方法、基于能量泛函的分割方法、基于聚類的分割方法等。圖像分割指的是根據灰度、顏色、紋理和形狀

2017-12-20 11:06:04

108007

基于活動輪廓模型的圖像分割

針對目前基于參數活動輪廓模型（ PACM）的圖像分割方法不能精確定位到角點，不連續邊緣易受周圍無關信息影響的缺陷，提出一種基于參數活動輪廓模型的圖像分割新方法。該方法首先構造邊緣保護項，將其引入

2017-12-22 14:25:29

基于內容的圖像分割方法綜述

圖像分割是指將圖像分成若干具有相似性質的區域的過程，是許多圖像處理任務的預處理步驟．近年來，國內外學者主要研究基于圖像內容的分割算法，在廣泛調研大量文獻和最新成果的基礎上，將圖像分割算法分為基于圖論

2018-01-02 16:52:41

基于圖像局部灰度差異的噪聲圖像分割模型

圖像分割在計算機視覺處理技術中占據重要位置，是圖像處理和分析的關鍵步驟。基于水平集方法的活動輪廓模型被成功應用于在圖像分割領域，并取得了長足的發展，但噪聲圖像和弱邊界的分割問題，仍然具有挑戰性

2018-04-17 11:41:18

如何使用One-class SVM進行噪聲圖像分割方法的詳細資料說明

　為解決現有無監督圖像分割模型對強噪聲環境魯棒性差、無法適應復雜混合噪聲的問題，提出了一種基于One-classSVM方法的改進后的噪聲魯棒圖像分割模型。首先，基于One-classSVM構建

2019-04-11 17:43:50

DeepLab進行語義分割的研究分析

DeepLab是谷歌使用tensorflow基于CNN開發的語義分割模型，至今已更新4個版本。最新版本是DeepLabv3+，在此模型中進一步將深度可分離卷積應用到孔空間金字塔池化和解碼器模塊，從而

2019-10-24 08:00:00

百度飛槳雙技術助力無人機應用，實現多場景應用和準確率提升

PaddleSeg是基于飛槳開發的端到端圖像分割開發套件，覆蓋了DeepLabv3+， U-Net， ICNet， PSPNet， HRNet， Fast-SCNN等主流分割網絡。通過模塊化的設計，以配置化方式驅動模型組合，幫助開發者更便捷地完成從訓練到部署的全流程圖像分割應用。

2020-09-20 10:53:09

1760

圖像分割技巧資料

圖像分割也是 Kaggle 中的一類常見賽題，比如衛星圖像分割與識別、氣胸疾病圖像分割等。除了密切的團隊配合、給力的 GPU 配置等條件，技巧在這類比賽中也發揮了很大的作用。

2020-09-24 11:11:56

1573

深度學習中圖像分割的方法和應用

分析和分類以及機器人和自動駕駛車輛的圖像處理等應用上。許多計算機視覺任務需要對圖像進行智能分割，以理解圖像中的內容，并使每個部分的分析更加容易。今天的圖像分割技術使用計算機視覺深度學習模型來理解圖像的每個像素

2020-11-27 10:29:19

2857

圖像分割的背景知識

U-Net是一種卷積神經網絡，最初是為分割生物醫學圖像而開發的。當它被可視化的時候，它的架構看起來像字母U，因此被命名為U-Net。其體系結構由兩部分組成，左側為收縮路徑，右側為擴展路徑。收縮路徑的目的是獲取上下文，而擴展路徑的作用是幫助精確定位。

2020-12-28 14:22:51

2259

改進ResU-Net有利于角膜神經圖像自動分割

角膜神經圖像的自動分割對于糖尿病神經病變等疾病的診斷與篩査至關重要。針對由于角膜神經圖像存在對比度低且包含非神經結構而造成分割效率較低的問題，在 Resu-Net結構基礎上引入多尺度殘差、注意力機制

2021-03-12 15:13:58

結合雙目圖像的深度信息跨層次特征的語義分割模型

為改善單目圖像語義分割網絡對圖像深度變化區域的分割效果，提出一種結合雙目圖像的深度信息和跨層次特征進行互補應用的語義分割模型。在不改變已有單目孿生網絡結構的前提下，利用該模型分別提取雙目左、右輸入

2021-03-19 14:35:24

基于Deeplabv3架構的串聯空洞卷積神經網絡

室外網球場實景環境下的語義分割是開發網球運動服務機器人需要解決的一項關鍵技術。針對室外網球場環境由于光照、視角等因素的變化導致難以進行精細分割的問題，提出一種基于 Deeplabv3架構的串聯空洞

2021-04-29 14:51:08

基于SEGNET模型的圖像語義分割方法

使用原始 SEGNET模型對圖像進行語義分割時，未對圖像中相鄰像素點間的關系進行考慮，導致同一目標中像素點類別預測結果不一致。通過在 SEGNET結構中加入一條自上而下的通道，使得 SEGNET包含

2021-05-27 14:54:54

一種高精度的肝臟圖像自動分割算法

在利用卷積神經網絡分割肝臟邊界較模糊的影像數據時容易丟失位置信息，導致分割精度較低。針對該問題，提出一種基于分水嶺修正與U-Net模型相結合的肝臟圖像自動分割算法。利用U-Net分層學習圖像特征

2021-05-27 15:17:35

基于變分水平集模型的多相圖像分割

多相圖像分割通常利用多個水平集函數分別定義不同區域的特征函數，其極值求解問題需要對多個函數分別求極值，計算效率較低。針對三維多相圖像，提出一種改進的變分水平集模型，采用一個多層水平集函數的n層水平

2021-05-28 10:26:59

基于U-net分割的遙感圖像配準方法

在利用航拍遙感圖像進行土地測量與變化檢測時，需要對圖像進行配準處理。為實現目標區域的高精度匹配，提出一種遙感圖像配準方法。對圖像進行U-net分割，以適用于小樣本數據集的處理，針對不同區域特征的誤差

2021-05-28 14:41:39

基于拆棍變分貝葉斯推斷的圖像分割算法

為提高圖像分割的抗噪魯棒性并解決分割數目的自適應確定問題，通過在聚類標簽先驗概率的折棍構造過程中建立 Markov隨機場，將空間相關性約束引λ Dirichlet過程混合模型的概率建模，使聚類的空間

2021-06-04 15:27:33

基于Contourlet域下的聲吶圖像分割算法

水下環境復雜多變，導致聲吶技術成像后的圖像質量差，影響目標識別。為此，提出一種基于 Contourlet域下多尺度高斯馬爾可夫隨機場（GMRF）模型的水平集聲吶圖像分割算法。采用

2021-06-15 11:43:36

基于測地線活動輪廓模型的合成孔徑雷達圖像分割

2021-07-02 11:10:31

淺談關于深度學習方法的圖像分割

許多計算機視覺任務需要對圖像進行智能分割，以理解圖像中的內容，并使每個部分的分析更加容易。今天的圖像分割技術使用計算機視覺深度學習模型來理解圖像的每個像素所代表的真實物體，這在十年前是無法想象

2021-07-06 10:50:35

1981

改進自適應GACV的水下圖像分割算法研究

改進自適應GACV的水下圖像分割算法研究(通信電源技術20年第13期)-基于改進自適應GACV的水下圖像分割算法研究摘要論文針對水下彩色圖像對比度低、模糊、偏色等退化問題，研究了幾何活動輪廓模型

2021-09-22 15:32:10

使用OpenVINO? 部署PaddleSeg模型庫中的DeepLabV3+模型

下的DeepLabV3+路面語義分割模型轉換為OpenVINO ? 工具套件的IR模型并且部署到CPU上。 ? 為了使本文擁有更廣的受眾面，文章的目標部署平臺選擇了CPU和iGPU。關于如何部署到邊緣設備例如Intel

2021-11-22 14:58:12

8970

數坤科技3D卷積神經網絡模型用于肝臟MR圖像的精準分割

該項研究采用了基于多序列的3D卷積神經網絡模型，由數坤科技自主研發，用于肝臟MR圖像的精準分割。

2022-04-02 16:06:11

3522

一個具有泛化性的小樣本語義分割（GFS-Seg）

訓練語義分割模型需要大量精細注釋的數據，這使得它很難快速適應不滿足這一條件的新類，FS-Seg 在處理這個問題時有很多限制條件。

2022-09-13 08:56:04

1542

當UNet與HRNet碰撞會產生怎樣的火花？U-HRNet不做選擇

U-Net在一定程度上緩解了上述兩個問題。然而，在U-Net中，每個階段只保留一個分辨率，不同尺度之間沒有融合，只有與殘差分支合并。作者認為，HRNet的最大優勢是能夠并行維護多尺度并始終執行多尺度融合。

2022-11-07 14:27:00

978

在NGC上玩轉圖像分割！NeurIPS頂會模型、智能標注10倍速神器、人像分割SOTA方案、3D醫療影像分割利器應有盡有

PaddleSeg 近期帶來重大升級，覆蓋最新頂會模型、10 倍提速的智能標注工具、實時人像分割 SOTA 方案、全新 3D 醫療影像分割方案等。歡迎廣大開發者使用 NVIDIA 與飛槳聯合深度

2022-11-21 21:05:02

731

輕松學Pytorch之Deeplabv3推理

Torchvision框架中在語義分割上支持的是Deeplabv3語義分割模型，而且支持不同的backbone替換，這些backbone替換包括MobileNetv3、ResNet50、ResNet101。

2022-12-21 15:40:23

667

3D UX-Net：超強的醫學圖像分割新網絡

整體來說，這些模型性能是越來越高，在幾個主流的 3D 數據基準測試中也實現了大大小小的 SOTA，特別是 3D 醫學圖像分割這塊。當然，時代在進步，作為一名高科技前沿從業者本身也是需要不斷汲取新的知識營養才能不被輕易的淘汰。

2023-02-01 15:57:50

1365

一文讀懂圖像分割

圖像分割（Image Segmentation）是計算機視覺領域中的一項重要基礎技術，是圖像理解中的重要一環。

2023-02-28 09:55:53

1229

ImgX-DiffSeg：基于DDPMs的3D醫學圖像分割

DDPM 是一種生成模型，可用于圖像去噪和分割。工作原理是模擬干凈圖像的概率分布，然后在圖像中添加噪點以生成噪聲版本。相反的，模型嘗試通過移除添加的噪點來對圖像進行降噪。

2023-05-15 09:19:58

633

AI算法說-圖像分割

語義分割是區分同類物體的分割任務，實例分割是區分不同實例的分割任務，而全景分割則同時達到這兩個目標。全景分割既可以區分彼此相關的物體，也可以區分它們在圖像中的位置，這使其非常適合對圖像中所有類別的目標進行分割。

2023-05-17 14:44:24

810

SAM分割模型是什么？

SAM是一類處理圖像分割任務的通用模型。與以往只能處理某種特定類型圖片的圖像分割模型不同，SAM可以處理所有類型的圖像。

2023-05-20 09:30:45

1376

近期分割大模型發展情況

SAM（Segment Anything Model）Meta 的 FAIR 實驗室發布的一種最先進的圖像分割模型，該模型將自然語言處理領域的prompt范式引入計算機視覺領域，可以通過點擊、框選和自動識別三種交互方式，實現精準的圖像分割，突破性地提升了圖像分割的效率。

2023-05-22 16:26:22

480

在AI愛克斯開發板上用OpenVINO?加速YOLOv8-seg實例分割模型

《在 AI 愛克斯開發板上用 OpenVINO 加速 YOLOv8 目標檢測模型》介紹了在 AI 愛克斯開發板上使用 OpenVINO 開發套件部署并測評 YOLOv8 的目標檢測模型，本文將介紹在 AI 愛克斯開發板上使用 OpenVINO 加速 YOLOv8-seg 實例分割模型。

2023-06-05 11:52:15

561

人體分割識別圖像技術的原理及應用

人體分割識別圖像技術是一種將人體從圖像中分割出來，并對人體進行識別和特征提取的技術。該技術主要利用計算機視覺和圖像處理算法對人體圖像進行預處理、分割、特征提取和識別等操作，以實現自動化的身份認證

2023-06-15 17:44:49

635

沒你想的那么難 | 一文讀懂圖像分割

來源：圖靈Topia（ID：turingtopia）圖像分割（ImageSegmentation）是計算機視覺領域中的一項重要基礎技術，是圖像理解中的重要一環。近日，數據科學家

2023-05-16 09:21:44

570

DeepLabV3開發板應用

電子發燒友網站提供《DeepLabV3開發板應用.zip》資料免費下載

2023-06-20 15:05:14

用OpenVINO? C++ API編寫YOLOv8-Seg實例分割模型推理程序

本文章將介紹使用 OpenVINO 2023.0 C++ API 開發YOLOv8-Seg 實例分割（Instance Segmentation）模型的 AI 推理程序。本文 C++ 范例程序的開發環境是 Windows + Visual Studio Community 2022。

2023-06-25 16:09:44

650

在AI愛克斯開發板上用OpenVINO?加速YOLOv8-seg實例分割模型

2023-06-30 10:43:54

420

什么是圖像分割？圖像分割的體系結構和方法

圖像分割（Image Segmentation）是計算機視覺領域中的一項重要基礎技術，是圖像理解中的重要一環。前端時間，數據科學家Derrick Mwiti在一篇文章中，就什么是圖像分割、圖像分割架構、圖像分割損失函數以及圖像分割工具和框架等問題進行了討論，讓我們一探究竟吧。

2023-08-18 10:34:04

2072

使用PyTorch加速圖像分割

2023-08-31 14:27:10

440

深度學習圖像語義分割指標介紹

深度學習在圖像語義分割上已經取得了重大進展與明顯的效果，產生了很多專注于圖像語義分割的模型與基準數據集，這些基準數據集提供了一套統一的批判模型的標準，多數時候我們評價一個模型的性能會從執行時間、內存使用率、算法精度等方面進行考慮。

2023-10-09 15:26:12

120

機器視覺（六）：圖像分割

基于閾值的分割方法是一種應用十分廣泛的圖像分割技術，其實質是利用圖像的灰度直方圖信息獲取用于分割的閾值，一個或幾個閾值將圖像的灰度級分為幾個部分，認為屬于同一部分的像素是同一個物體。

2023-10-22 11:34:28

413

如何基于PaddlePaddle平臺訓練并測試一個視盤圖像分割的基本模型

講講如何基于 PaddlePaddle 平臺，訓練并測試一個視盤圖像分割的基本模型。 1.準備為了實現這個實驗，Python 是必不可少的，如果你還沒有安裝 Python，建議閱讀我們的這篇文章：超詳細Python安裝指南。在安裝前，確認自己需要的 Paddl

2023-11-01 09:20:00

299

機器視覺圖像分割的方法有哪些？

現有的圖像分割方法主要分以下幾類：基于閾值（threshold）的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。

2023-11-02 10:26:39

199

為什么需要分割？U-Net能提供什么？U-Net和自編碼器的區別

U-Net是一種卷積神經網絡（CNN）方法，由Olaf Ronneberger、Phillip Fischer和Thomas Brox于2015年首次提出，它可以更好的分割生物醫學圖像。

2023-11-25 11:38:13

1259

已全部加載完成

搜索歷史

淺談DeepLabV3\U2Net\HRNet-seg模型的圖像分割調優

評論