百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

MATLAB中SVM的用法

moboyou 2025-04-22 00:39 17 浏览

LIBSVM是台湾大学林智仁(Lin Chih-Jen)教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题;并提供了交互检验(Cross Validation)的功能。该软件可以解决C-SVM、ν-SVM、ε-SVR和ν-SVR等问题,包括基于一对一算法的多类模式识别问题。注意不是matlab自带的svm实现函数。

  1. model = libsvmtrain(training_label_vector, training_instance_matrix [, ‘libsvm_options’]);

这个函数有三个参数,其中

-training_label_vector:训练样本的类标,如果有m个样本,就是m x 1的矩阵(类型必须为double)。这里可以是二分类和多分类,类标是(-1,1)、(1,2,3)或者其他任意用来表示不同的类别的数字,要转成double类型。


-training_instance_matrix:训练样本的特征,如果有m个样本,每个样本特征是n维,则为m x n的矩阵(类型必须为double)。

-libsvm_options:训练的参数,在第3点详细介绍。

libsvmtrain函数返回训练好的SVM分类器模型model是一个结构体,包含以下成员:

-Parameters: 一个5 x 1的矩阵,从上到下依次表示:

-s SVM类型(默认0);

-t 核函数类型(默认2)

-d 核函数中的degree设置(针对多项式核函数)(默认3);

-g 核函数中的r(gamma)函数设置(针对多项式/rbf/sigmoid核函数) (默认类别数目的倒数);

-r 核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)

-nr_class: 表示数据集中有多少类别,比如二分类时这个值即为2。

-totalSV: 表示支持向量的总数。

-rho: 决策函数wx+b中的常数项的相反数(-b)。

-Label: 表示数据集中类别的标签,比如二分类常见的1和-1。

-ProbA: 使用-b参数时用于概率估计的数值,否则为空。

-ProbB: 使用-b参数时用于概率估计的数值,否则为空。

-nSV: 表示每类样本的支持向量的数目,和Label的类别标签对应。如Label=[1; -1],nSV=[63; 67],则标签为1的样本有63个支持向量,标签为-1的有67个。

-sv_coef: 表示每个支持向量在决策函数中的系数。

-SVs: 表示所有的支持向量,如果特征是n维的,支持向量一共有m个,则为m x n的稀疏矩阵。

另外,如果在训练中使用了-v参数进行交叉验证时,返回的不是一个模型,而是交叉验证的分类的正确率或者回归的均方根误差。

当构建完成model后,还要为上述参数选择合适的值,方法主要有Gridsearch,其他的感觉不常用,Gridsearch说白了就是穷举。

网格参数寻优函数(分类问题):SVMcgForClass

[bestCVaccuracy,bestc,bestg]=SVMcgForClass(train_label,train,cmin,cmax,gmin,gmax,v,cstep,gstep,accstep)

输入:

train_label:训练集的标签,格式要求与svmtrain相同。

train:训练集,格式要求与svmtrain相同。

cmin,cmax:惩罚参数c的变化范围,即在[2^cmin,2^cmax]范围内寻找最佳的参数c,默认值为cmin=-8,cmax=8,即默认惩罚参数c的范围是[2^(-8),2^8]。

gmin,gmax:RBF核参数g的变化范围,即在[2^gmin,2^gmax]范围内寻找最佳的RBF核参数g,默认值为gmin=-8,gmax=8,即默认RBF核参数g的范围是[2^(-8),2^8]。

v:进行Cross Validation过程中的参数,即对训练集进行v-fold Cross Validation,默认为3,即默认进行3折CV过程。

cstep,gstep:进行参数寻优是c和g的步进大小,即c的取值为2^cmin,2^(cmin+cstep),…,2^cmax,,g的取值为2^gmin,2^(gmin+gstep),…,2^gmax,默认取值为cstep=1,gstep=1。

accstep:最后参数选择结果图中准确率离散化显示的步进间隔大小([0,100]之间的一个数),默认为4.5。

输出:

bestCVaccuracy:最终CV意义下的最佳分类准确率。

bestc:最佳的参数c。

bestg:最佳的参数g。

网格参数寻优函数(回归问题):SVMcgForRegress

[bestCVmse,bestc,bestg]=SVMcgForRegress(train_label,train,cmin,cmax,gmin,gmax,v,cstep,gstep,msestep)

其输入输出与SVMcgForClass类似,这里不再赘述。

SVM 怎样能得到好的结果:

  1. 对数据做归一化(simple scaling)
  2. 应用 RBF kernel
  3. 用cross-validation和grid-search 得到最优的c和g
  4. 用得到的最优c和g训练训练数据
  5. 测试

libsvm使用误区:

(1) 直接将训练集合和测试集合简单归一化到[0,1]区间,可能导致实验结果很差。

(2) 如果样本的特征数非常多,那么就不必使用RBF核将样本映射到高维空间。

a) 在特征数非常多的情况下,使用线性核,结果已经非常好,并且只需要选择参数C即可。

b) 虽然说RBF核的结果至少比线性核好,前提下搜索整个的空间。

(3) 样本数<<特征数的情况:推荐使用线性核,可以达到与RBF同样的性能。

(4) 样本数和特征数都非常多:推荐使用liblinear,更少的时间和内存,可比的准确率。

(5) 样本数>>特征数:如果想使用线性模型,可以使用liblinear,并且使用-s 2参数

相关推荐

触乐怪话:存在于这个世界_触乐怪话存在于这个世界中吗

触乐怪话,每天胡侃和游戏有关的屁事、鬼事、新鲜事。太有意境了(图/小罗)童年时,人多的环境总让我感到压抑,幼儿园的时光大多在请假中度过。在家里,我的避世天地由两种爱好构成:家人电脑里的《帝国时代2》,...

表格是职场必备神器! 零基础也能快速上手——第7期

第七期:给学生分班。这一期会涉及几个函数公式,不要害怕,一点点的深入学习。我们不需要死记硬背,收藏起来,用的时候直接复制。我们需要学习的是概念,知道函数的意思,遇到想要解决的问题,能知道这个效果可以实...

福彩3D胆码公式趣谈:数字游戏里的&quot;规律&quot;探索指南

彩票的魅力,在于它用一组简单的数字,承载了人们对"意外惊喜"的无限想象。对于福彩3D这类数字型彩票,许多爱好者常热衷于研究"胆码公式"——试图通过历史开奖数据推导可能的...

航旅纵横9.9元精准延误险被吐槽,消费者直呼像 “买彩票”

近期,航旅纵横推出了一款9.9元的“惊喜数字”精准延误险,引发不少消费者吐槽。该产品因理赔条件苛刻,被指误导消费者,甚至有消费者认为其“赔付概率几乎为零,类似竞猜游戏”。据悉,该保险产品每天随机设...

Excel如何批量将数据拆分为多个数字之和

今天跟大家分享一下Excel如何批量将数据拆分为多个数字之和1.如下图C列含有一些数值,现在我们想要将这列数值拆分为三个数值之和。2.首先我们选中C2:C10单元格区域3.然后点击下图选项(Excel...

Go中select用法_go语言中的select

什么是selectselect语句用于从多个发送/接收通道操作中进行选择。select语句将一直阻塞,直到其中一个发送/接收操作准备就绪。如果多个操作准备就绪,则随机选择其中一个。语法类似于swi...

VLOOUP和MATCH函数公式组合太强了,高手必会!

传统的函数公式,更注重函数组合使用,VLOOKUP和MATCH函数公式组合,在工作中,经常能解决各种复杂的难题1、VLOOKUP+MATCH,一次性匹配多个值例如,现在左边的数据源,我们需要一交性匹配...

如何将人名打乱,随机排序?#excel技巧

人名打乱,随机排序。如何在需要随机分组时把现有人名打乱并进行随机排序呢?首先,随机排序用到的是排序函数,即数组函数sosby,然后对其进行排序,将其选中即可。那排序的依据是什么呢?因为要随机排序,所...

Power Query 随机抽样的自定义函数编写

在Excel中我们有Rand函数、Randbetween函数,我们可以产生随机数,然后通过这个随机数,作为索引,提取一行或一列中某个位置的数据。可以配合CHOOSE,INDEX等函数来实现随机抽取数据...

吾爱大神写的 随机选人(课堂小工具)

使用方法1导入名单(一行一个,从EXCEL复制到记事本即可,或者按照上图图解保存)2点击随机选人按钮提示1按按钮后蓝色方框无文字显示,代表所有人已被抽过,继续点击将开始新的一轮2按F5可以重新...

Excel 选不了单元格?3个高频原因 + 对应解法,5 分钟恢复操作

在使用Excel处理数据时,突然遇到单元格无法选定的情况,往往会打乱工作节奏。这种故障并非随机出现,通常与工作表保护设置、格式冲突或功能模式有关。本文将拆解3个高频原因,每个原因都配套1分钟排查...

CHOOSE函数的4个典型用法_choose函数公式怎么用

CHOOSE函数可以根据给定的索引号,返回参数列表中的值,其语法为CHOOSE(index_num,value1,[value2]...)。CHOOSE函数经常和其他函数一起组合使用,起着增强其他函数...

破解 20以内退位减法难题,这6 个实用方法助力孩子轻松掌握!

对于一年级的小朋友来说,不进位加法和进位加法比较容易,但减法比较难,特别是退位减法。我投身一线教学工作已近二十载。在此,我将结合一年级学生在学习20以内退位减法时的常见困境,提出六条具有实用性的建...

C语言随机数生成_c语言随机数如何生成

C语言rand和srand用法详解,在C语言实际编程过程中经常要使用到随机函数。例如,贪吃蛇游戏中在随机的位置出现食物,扑克牌游戏中随机发牌。在C语言中,我们一般使用<stdlib.h>...

千禧年大奖难题BSD猜想进展:这些整数可以写成两个有理数立方和

选自quantamagazine作者:EricaKlarreich机器之心编译机器之心编辑部这项工作第一次明确了有多少整数可以写成两个分数的立方和今年早些时候,三位数学家讨论了数论中最古老的问题之一...