百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

自动驾驶之-MATLAB环境下基于深度学习的语义分割

moboyou 2025-04-25 13:12 25 浏览

深度学习,一个大号的,现代的,黑箱的,信号/图像处理器,本文程序运行环境为MATLAB R2018A。

详细代码

https://mianbaoduo.com/o/bread/Y5mYmZtq

本文简单讲解如何使用深度学习网络进行语义分割。语义分割网络对图像中的每个像素进行分类,从而生成按类别分割的图像,本文将语义分割应用于自动驾驶的道路分割。

为了说明训练过程,本文训练一个SegNet网络,这是一种用于图像语义分割的卷积神经网络 (CNN)。其他类型的语义分割网络包括全卷积网络(FCN)和U-Net等等。

本文使用剑桥大学的CamVid 数据集进行训练,数据集包括驾驶时获得的街道视图图像,为32个语义类(包括汽车、行人和道路)提供像素级标签。

同时还使用VGG-16网络的权重初始化SegNet 网络,因此需要安装 VGG-16 网络模型。

vgg16();

建议使用计算能力为 3.0 或更高版本的具有 CUDA 功能的 NVIDIATM GPU 来运行,使用 GPU 需要并行计算工具箱。

CamVid数据集

下载的CamVid图像及相应的像素标记图如下

加载CamVid图像

使用imageDatastore函数加载CamVid图像

imgDir = fullfile(outputFolder,'images','701_StillsRaw_full');
imds = imageDatastore(imgDir);

展示其中一张图像

I = readimage(imds,1);
I = histeq(I);
imshow(I)

加载CamVid像素标记图像

使用 pixelLabelDatastore函数加载CamVid像素标记图像数据。

按照原始SegNet论文,将 CamVid 中的 32 个原始类别分组为11个类别

classes = [
    "Sky"
    "Building"
    "Pole"
    "Road"
    "Pavement"
    "Tree"
    "SignSymbol"
    "Fence"
    "Car"
    "Pedestrian"
    "Bicyclist"
    ];

要将32个类别减少到 11 个类别,需要将原始数据集中的多个类别组合在一起。例如,"Car" 是“Car”,“SUVPickupTruck”,“Truck_Bus”,“Train”和“OtherMoving”的组合。使用camvidPixelLabelIDs函数返回分好组的标签 ID。

labelIDs = camvidPixelLabelIDs();

使用类别和标签 ID 创建pixelLabelDatastore

labelDir = fullfile(outputFolder,'labels');
pxds = pixelLabelDatastore(labelDir,classes,labelIDs);

将一个像素标记图像进行叠加,读取并显示该图像

C = readimage(pxds,1);
cmap = camvidColorMap;
B = labeloverlay(I,C,'ColorMap',cmap);
imshow(B)
pixelLabelColorbar(cmap,classes);

分析数据集统计信息

使用 countEachLabel函数查看CamVid 数据集中类别标签分布

tbl = countEachLabel(pxds)
tbl=11×3 table
        Name        PixelCount    ImagePixelCount
    ____________    __________    _______________

    'Sky'           7.6801e+07      4.8315e+08   
    'Building'      1.1737e+08      4.8315e+08   
    'Pole'          4.7987e+06      4.8315e+08   
    'Road'          1.4054e+08      4.8453e+08   
    'Pavement'      3.3614e+07      4.7209e+08   
    'Tree'          5.4259e+07       4.479e+08   
    'SignSymbol'    5.2242e+06      4.6863e+08   
    'Fence'         6.9211e+06       2.516e+08   
    'Car'           2.4437e+07      4.8315e+08   
    'Pedestrian'    3.4029e+06      4.4444e+08   
    'Bicyclist'     2.5912e+06      2.6196e+08   

按类别可视化像素计数

frequency = tbl.PixelCount/sum(tbl.PixelCount);
bar(1:numel(classes),frequency)
xticks(1:numel(classes)) 
xticklabels(tbl.Name)
xtickangle(45)
ylabel('Frequency')

理想情况下,所有类别的数目应该相等。但是,CamVid数据集中的类别是不平衡的,因此可以使用类别加权算法来处理。

调整CamVid数据

CamVid 数据集中的图像大小为720 x 960,为减少训练时间和内存占用,将图像大小和像素标签图像调整为 360 x 480。

imageFolder = fullfile(outputFolder,'imagesResized',filesep);
imds = resizeCamVidImages(imds,imageFolder);
labelFolder = fullfile(outputFolder,'labelsResized',filesep);
pxds = resizeCamVidPixelLabels(pxds,labelFolder);

准备训练集和测试集

SegNet网络使用数据集中 60% 的图像进行训练

训练和测试图像数量

numTrainingImages = numel(imdsTrain.Files)
numTestingImages = numel(imdsTest.Files)

创建网络

使用 segnetLayers函数创建SegNet网络,segnetLayers可自动从VGG-16网络中迁移权重

imageSize = [360 480 3];
numClasses = numel(classes);
lgraph = segnetLayers(imageSize,numClasses,'vgg16');

类别加权平衡

imageFreq = tbl.PixelCount ./ tbl.ImagePixelCount;
classWeights = median(imageFreq) ./ imageFreq

classWeights = 11×1

0.3182
0.2082
5.0924
0.1744
0.7103
0.4175
4.5371
1.8386
1.0000
6.6059

使用 pixelClassificationLayer 函数指定类别权重

pxLayer = pixelClassificationLayer('Name','labels','ClassNames',tbl.Name,'ClassWeights',classWeights)

移除当前的pixelClassificationLayer层,使用新的pixelClassificationLayer层更新 SegNet 网络,然后使用 connectLayers 函数将新层连接到网络。

lgraph = removeLayers(lgraph,'pixelLabels');
lgraph = addLayers(lgraph, pxLayer);
lgraph = connectLayers(lgraph,'softmax','labels');

指定训练参数

用于训练的优化算法是带动量的随机梯度下降 (SGDM)方法,使用trainingOptions指定用于 SGDM 的超参数。

options = trainingOptions('sgdm', ...
    'Momentum',0.9, ...
    'InitialLearnRate',1e-3, ...
    'L2Regularization',0.0005, ...
    'MaxEpochs',100, ...  
    'MiniBatchSize',4, ...
    'Shuffle','every-epoch', ...
    'VerboseFrequency',2);

数据增强

在训练过程中使用数据增强方法为网络提供更训练样本,有助于提高网络的分类准确率。

augmenter = imageDataAugmenter('RandXReflection',true,...
    'RandXTranslation',[-10 10],'RandYTranslation',[-10 10]);

开始训练

使用pixelLabelImageDatastore组合训练数据和数据增强选项,为训练网络做准备

pximds = pixelLabelImageDatastore(imdsTrain,pxdsTrain,...
    'DataAugmentation',augmenter);


[net, info] = trainNetwork(pximds,lgraph,options);

在某一图像上测试网络

为了快速测试网络,在一个测试图像上运行训练好的网络

I = read(imdsTest);
C = semanticseg(I, net);

显示结果

B = labeloverlay(I,C,'Colormap',cmap,'Transparency',0.4);
imshow(B)
pixelLabelColorbar(cmap, classes);

将C中的结果与 pxdsTest 中存储的真实值进行比较,绿色和洋红色区域突出显示分割结果与真实值不同的区域。

expectedResult = read(pxdsTest);
actual = uint8(C);
expected = uint8(expectedResult);
imshowpair(actual, expected)

从视觉效果上看,语义分割结果对于道路、天空和建筑物等类别较好。然而,较小的物体,如行人和汽车,并不那么准确。每个类别的重叠量可以使用IoU 指标(也称为 Jaccard )衡量。

iou = jaccard(C, expectedResult);
table(classes,iou)

ans=11×2 table
      classes         iou   
    ____________    ________

    "Sky"            0.92659
    "Building"        0.7987
    "Pole"           0.16978
    "Road"           0.95177
    "Pavement"       0.41877
    "Tree"           0.43401
    "SignSymbol"     0.32509
    "Fence"            0.492
    "Car"           0.068756
    "Pedestrian"           0
    "Bicyclist"            0

道路、天空和建筑类别的 IoU 分数较高,而行人和汽车等类别的分数较低

评估网络

对整个测试集进行语义分割

pxdsResults = semanticseg(imdsTest,net,'WriteLocation',tempdir,'Verbose',false);

semanticseg函数将测试集的结果作为pixelLabelDatastore对象返回,imdsTest中每个测试图像的实际像素标记数据将写入磁盘。使用
evaluateSemanticSegmentation 可以测量测试集结果上的语义分割指标。

metrics = evaluateSemanticSegmentation(pxdsResults,pxdsTest,'Verbose',false);


evaluateSemanticSegmentation函数返回整个数据集、单个类别和每个测试图像的各种指标。查看数据集指标,键入metrics.DataSetMetrics .

metrics.DataSetMetrics

ans=1×5 table
    GlobalAccuracy    MeanAccuracy    MeanIoU    WeightedIoU    MeanBFScore
    ______________    ____________    _______    ___________    ___________

       0.88204          0.85097       0.60893      0.79795        0.60981  


若要查看每个类别对整体性能的影响,键入metrics.ClassMetrics.

metrics.ClassMetrics

ans=11×3 table
                  Accuracy      IoU      MeanBFScore
                  ________    _______    ___________

    Sky           0.93493     0.89244      0.88152  
    Building      0.79776     0.75263      0.59707  
    Pole          0.72635     0.18662      0.52252  
    Road          0.93676     0.90672      0.71043  
    Pavement      0.90674     0.72865      0.70362  
    Tree          0.86657     0.73747      0.66421  
    SignSymbol     0.7559     0.34519      0.43401  
    Fence         0.82807     0.50592       0.5083  
    Car           0.91187     0.75001      0.64352  
    Pedestrian    0.84866     0.35046      0.45551  
    Bicyclist     0.84705     0.54208      0.46818  

尽管整体数据集性能相当高,但类别指标显示,行人、骑自行车者和汽车类别与道路、天空和建筑物等类相比,没有被分割。

参考文献

[1] Badrinarayanan, Vijay, Alex Kendall, and Roberto Cipolla. "SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation." arXiv preprint arXiv:1511.00561, 2015.

[2] Brostow, Gabriel J., Julien Fauqueur, and Roberto Cipolla. "Semantic object classes in video: A high-definition ground truth database." Pattern Recognition Letters Vol 30, Issue 2, 2009, pp 88-97.

相关推荐

Excel批量生成随机人名_excel批量生成随机数

之前的文章讲过怎么用在Excel生成随机银行名字。今天继续给大家分享下怎么在Excel生成随机人名。随机数据工具包书接上回,本文对之前的随机数据生成工具包进行封装调用,生成的结果直接写入到Excel表...

一学就会:Excel MOD函数,让数字周期循环变得easy

今日推荐:MOD函数。目的:根据当前日期在年内的周数对5个小组取余,再根据余数的值获取对应的值班小组。MOD函数也可以作为获取随机数的一种,只不过这种随机数是有一定规律的。【函数介绍】MOD——返回两...

1条公式,自动随机分配座位,你会么?

随机座位困局、老办法效率低、新公式能否破局?.上周学校开会说要给教室换排座位,教务处老师愁得头发都快白了。以前都是靠老师自己写名单再划拉划分组,现在新教室三列座位,学生又多,折腾了三天都没摆顺当。听说...

excel快速制作姓名随机分配表_姓名随机分组

快速制作随机分配表。当需要把这一列的姓名进行随机分组应该怎么操作?是不是还在一行一行的去复制粘贴,这样效率是非常慢的。怎么快速的制作一个随机的分组?·首先在第一组输入等于第一个姓名的A2单元格,双击填...

Excel里实现随机分组案例:导入名单随机分组

大家好呀,今天来给大家分享如何快速在Excel里实现随机分组。如下图所示,有15个人,现在要随机分成3组,每组5个人。只要简单两步,就能完成分组。第一步:为每个人设置一个随机数并编序号C列输入公式=R...

办公必备的15个Excel技巧,绝对的硬核干货,收藏备用

Excel的灵魂在于数据的分析与统计,而分析与统计就离不开函数或公式,今天要给大家分享的15个函数公式,是工作中常用的,可以直接套用。一、从身份证号码中提取出生年月。函数1:Tex...

Excel如何将某单元格区域数据随机排序

如下图是某公司人员名单,现在想要对这些员工进行随机分组。即对单元格区域内数据进行随机排序。选中B2:E10单元格区域点击下图选项(Excel工具箱,百度它即可了解详细的下载安装方法,本文这里就不做具体...

一键生成随机口算题,Excel工具妙用

小学生每天都要做口算,今天我给大家分享一下如何用excel来自制小学生的口算题。看我这里已经做好了,它的公式是这样,然后往下去拉,想要多少要多少,而且每一道题都是随机的。而且这一个表做好了之后,只要让...

Excel秒变抽签神器!1分钟搞定随机点名/抽奖

还在为年会抽奖、课堂点名、分组任务抓狂?别求人写代码啦!Excel自带隐藏大招1分钟设置,永久使用,按个键就能开抽超简单3步设置(有手就会版)1随机号生成在姓名表旁新建「随机号」列输入=RAND...

基础函数20例,案例解读,再不掌握就真的Out了

Excel中的函数是Excel的一个重要工具,如果你不及时掌握,对于Excel的应用、工作效率等会受到很大的影响,今天,小编给大家分享20个Excel的基础函数,对大家肯定很有帮助。练习文件在文末领取...

怎么利用Excel实现随机取样_excel随机取数据

今天跟大家分享一下Excel如何随机抽样1.打开Excel软件2.选中要抽取数据的单元格区域3.点击下图选项(Excel工具箱,百度即可了解详细下载安装信息,本文这里就不做详细解说。)4.点击【统计与...

1分钟学会Excel总表更新,分表实时同步,再也不用熬夜了!

你是不是还在用筛选→复制→粘贴的老方法拆分Excel数据?每次按类别整理报表都要折腾半小时?别傻了!今天教你用FILTER函数一键搞定,数据更新还能自动同步!第一步:准备工作表新建3个工作表,分...

excel计算几个数范围,excel怎么计算一个范围的个数

excel怎么计算某些范围的数的个数,需要计算0-5,5-10,10-15,……1000的...比如这些数字在A列,从B1至B10求10个范围的数量。在B1输入:=countif(a:a,=10)在B...

让Excel随机排序_excel如何设置随机排序

随机排序如下图,希望对A列的应聘人员随机安排面试顺序。先将标题复制到右侧的空白单元格内,然后在第一个标题下方输入公式:=SORTBY(A2:B11,RANDARRAY(10),1)RANDARRAY的...

对人员进行随机分组,分步骤详细解释,看了就学会了

大家好,我是套路EXCEL!如上图,需要将12个人随机分成3组,每组4人。函数公式如下:=ROUNDUP(CHOOSECOLS(SORT(HSTACK(ROW(1:12),RANDARRAY(12...