百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂

moboyou 2025-05-15 19:40 40 浏览

一、拟合和回归的区别

拟合并不特指某一种方法,指的是对一些数据,按其规律方程化,比如把平面(一元)上一系列的离散点,用一条直线(线性)或光滑的曲线(非线性)连接起来,而其方程化的方法有很多,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,是其中一种最常见的拟合方法,还有指数平滑这样简单一些的方法,或者ARIMA,VAR,等等各种复杂一点的方法。

从离散点的角度看,它们都有靠近某条曲线的趋势,所以这些点都在朝曲线拟合,从曲线的角度看,那些离散点都在向自己靠拢,所以这些点都在回归到曲线。所以拟合表示离散点(可以拓展到高维特征)与某个曲线方程(可以拓展到模型)的偏差小(目标),回归表示如何找到这样的曲线方程或模型(方法

本文主要讲解拟合和回归这两个概念的区别和联系,对回归拟合的方法进行分类与总结,重点介绍了一元回归拟合的几种实现方法,关于多元回归拟合其实就是机器学习中的回归任务建模了,我后期会出案例分析!

二、回归拟合的分类

  • 采用回归的方法,拟合出自变量x和因变量y之间存在的关系(方程或模型):
    • 根据自变量数量,可以分为一元回归和多元回归;
    • 按照方法可以分为统计回归模型和机器学习回归模型;
    • 按照因变量的多少,可分为简单回归分析和多重回归分析;
    • 按照自变量和因变量之间的关系类型,可分为线性回归和非线性回归。

对于简单回归拟合(即只有一个因变量),可以进一步做以下分类:

  • 对于单自变量-----一元回归拟合
    • 一元线性回归拟合:y = ax + b
    • 一元非线性回归拟合:
      • 特征转化:通过应用非线性变换来改变特征的表示形式,比如取X的对数X’ = Ln(X),然后进行一元回归y=aX’
      • 多项式拟合:可以看成一种多元线性拟合,将其看为有n个特征的多元线性拟合, x为一个特征,x的平方为一个特征……
      • 其他函数拟合:指数函数、对数函数拟合等...
      • 机器学习拟合:采样神经网络(隐含层大于1)、树模型等进行拟合
  • 对于多自变量-------多元回归拟合
    • 多元线性回归拟合:y = a1x1 + a2x2 +a3x3 + ...
    • 多元非线性回归拟合(机器学习...)

三、一元线性回归拟合

准备数据

x=np.array([1,2,3,4,5,6.5,7,8])
y=np.array([1,4,9,13,30,25,49,70])

3.1 法一:np.polyfit

np.polyfit 是 NumPy 库中的一个函数,用于多项式拟合。它可以根据给定的数据点,拟合出一个多项式函数,返回拟合的系数。

a=np.polyfit(x,y,1)#用1次多项式拟合x,y数组
print(a)
b=np.poly1d(a)#拟合完之后用这个函数来生成多项式对象
print(b)
c=b(x)#生成多项式对象之后,就是获取x在这个多项式处的值
plt.scatter(x,y,marker='o',label='original datas')#对原始数据画散点图
plt.plot(x,c,ls='--',c='red',label='fitting with second-degree polynomial')#对拟合之后的数据,也就是x,c数组画图
plt.legend()
plt.show()

a是系数:[ 8.83917084 -15.20371694]

b是方程:8.839 x - 15.2

3.2 法二:sklearn里面的LinearRegression()

# 定义回归模型
reg = LinearRegression()
x = np.array(x).reshape((len(x), 1))
reg.fit(x, y)
print(reg.coef_)
print(reg.intercept_)
plt.plot(x, y, 'b.')
plt.plot(x, reg.predict(x),'r')
plt.show()

将一元视为多元回归的一种特殊情况,即只有一个特征。

系数:reg.coef_:[8.83917084]

截距:reg.intercept_:-15.203716940671903

3.3 法三:curve_fit

curve_fit 是 SciPy 库中的一个函数,用于非线性曲线拟合。它可以根据给定的数据点和一个自定义的模型函数,拟合出最优的参数值,并返回拟合的参数以及协方差矩阵。

# 定义一个一元线性方程,变量一定要放在第一个位置
def func(x, a, b):
    return a * x + b

popt, pcov = curve_fit(func, x, y)
print(popt)  # 参数最佳值
y2 = func(x, popt[0], popt[1])
plt.scatter(x, y, marker='x', lw=1, label='原始数据')
plt.plot(x, y2, c='r', label='拟合曲线')
plt.legend()  # 显示label
plt.show()

最佳系数:popt:[ 8.83917082 -15.20371685]

四、一元多项式回归拟合(以2次多项式为例)

准备数据

x=np.array([1,2,3,4,5,6.5,7,8])
y=np.array([1,4,9,13,30,25,49,70])

4.1 法一:np.polyfit

a=np.polyfit(x,y,2)#用2次多项式拟合x,y数组
print(a)
b=np.poly1d(a)#拟合完之后用这个函数来生成多项式对象
print(b)
c=b(x)#生成多项式对象之后,就是获取x在这个多项式处的值
plt.scatter(x,y,marker='o',label='original datas')#对原始数据画散点图
plt.plot(x,c,ls='--',c='red',label='fitting with second-degree polynomial')#对拟合之后的数据,也就是x,c数组画图
plt.legend()
plt.show()

系数:[ 1.34960956 -3.36567929 5.01148555]

4.2 法二:sklearn里面的LinearRegression()

# 定义多项式回归, degree的值可以调节多项式的特征
poly_reg = PolynomialFeatures(degree=2)
# 特征处理
x = np.array(x).reshape((len(x), 1))
x_poly = poly_reg.fit_transform(x)
print(x_poly)
# 定义回归模型
reg = LinearRegression()
reg.fit(x_poly, y)
print(reg.coef_)
print(reg.intercept_)
plt.plot(x, y, 'b.')
plt.plot(x, reg.predict(x_poly), 'r')
plt.show()

系数:[ 0. -3.36567929 1.34960956]

截距:5.011485554320338

4.3 法三:curve_fit

# 定义一个二次多项式,变量一定要放在第一个位置
def func(x, a, b, c):
    return a * x ** 2 + b*x + c

popt, pcov = curve_fit(func, x, y) 
print(popt)  
y2 = func(x, popt[0], popt[1])
plt.scatter(x, y, marker='x', lw=1, label='原始数据')
plt.plot(x, y2, c='r', label='拟合曲线')
plt.legend()  # 显示label
plt.show()

系数:[ 1.34960956 -3.36567929 5.01148555]

五、一元其他函数回归拟合(指数函数为例)

准备数据

x=np.array([1,2,3,4,5,6.5,7,8])
y=np.array([1,4,9,13,30,25,49,70])

5.1 法:curve_fit

# 自定义一个想拟合的目标函数,变量一定要放在第一个位置
def func(x, a, b):
    return a * np.exp(x * b)

popt, pcov = curve_fit(func, x, y) 
print(popt)  # 即参数最佳值
y2 = func(x, popt[0], popt[1])
plt.scatter(x, y, marker='x', lw=1, label='原始数据')
plt.plot(x, y2, c='r', label='拟合曲线')
plt.legend()  # 显示label
plt.show()

系数:[2.47762425 0.41535845]

好了,本篇内容就到这里,我们下期再见!需要数据集和源码的小伙伴可以关注联系我!

原文链接:

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂它

作者简介:

读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。

相关推荐

Excel技巧:SHEETSNA函数一键提取所有工作表名称批量生产目录

首先介绍一下此函数:SHEETSNAME函数用于获取工作表的名称,有三个可选参数。语法:=SHEETSNAME([参照区域],[结果方向],[工作表范围])(参照区域,可选。给出参照,只返回参照单元格...

Excel HOUR函数:“小时”提取器_excel+hour函数提取器怎么用

一、函数概述HOUR函数是Excel中用于提取时间值小时部分的日期时间函数,返回0(12:00AM)到23(11:00PM)之间的整数。该函数在时间数据分析、考勤统计、日程安排等场景中应用广泛。语...

Filter+Search信息管理不再难|多条件|模糊查找|Excel函数应用

原创版权所有介绍一个信息管理系统,要求可以实现:多条件、模糊查找,手动输入的内容能去空格。先看效果,如下图动画演示这样的一个效果要怎样实现呢?本文所用函数有Filter和Search。先用filter...

FILTER函数介绍及经典用法12:FILTER+切片器的应用

EXCEL函数技巧:FILTER经典用法12。FILTER+切片器制作筛选按钮。FILTER的函数的经典用法12是用FILTER的函数和切片器制作一个筛选按钮。像左边的原始数据,右边想要制作一...

office办公应用网站推荐_office办公软件大全

以下是针对Office办公应用(Word/Excel/PPT等)的免费学习网站推荐,涵盖官方教程、综合平台及垂直领域资源,适合不同学习需求:一、官方权威资源1.微软Office官方培训...

WPS/Excel职场办公最常用的60个函数大全(含卡片),效率翻倍!

办公最常用的60个函数大全:从入门到精通,效率翻倍!在职场中,WPS/Excel几乎是每个人都离不开的工具,而函数则是其灵魂。掌握常用的函数,不仅能大幅提升工作效率,还能让你在数据处理、报表分析、自动...

收藏|查找神器Xlookup全集|一篇就够|Excel函数|图解教程

原创版权所有全程图解,方便阅读,内容比较多,请先收藏!Xlookup是Vlookup的升级函数,解决了Vlookup的所有缺点,可以完全取代Vlookup,学完本文后你将可以应对所有的查找难题,内容...

批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数

批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数在电商运营、物流对账等工作中,经常需要统计快递“揽收到签收”的耗时——比如判断某快递公司是否符合“3天内送达”的服务承...

Excel函数公式教程(490个实例详解)

Excel函数公式教程(490个实例详解)管理层的财务人员为什么那么厉害?就是因为他们精通excel技能!财务人员在日常工作中,经常会用到Excel财务函数公式,比如财务报表分析、工资核算、库存管理等...

Excel(WPS表格)Tocol函数应用技巧案例解读,建议收藏备用!

工作中,经常需要从多个单元格区域中提取唯一值,如体育赛事报名信息中提取唯一的参赛者信息等,此时如果复制粘贴然后去重,效率就会很低。如果能合理利用Tocol函数,将会极大地提高工作效率。一、功能及语法结...

Excel中的SCAN函数公式,把计算过程理清,你就会了

Excel新版本里面,除了出现非常好用的xlookup,Filter公式之外,还更新一批自定义函数,可以像写代码一样写公式其中SCAN函数公式,也非常强大,它是一个循环函数,今天来了解这个函数公式的计...

Excel(WPS表格)中多列去重就用Tocol+Unique组合函数,简单高效

在数据的分析和处理中,“去重”一直是绕不开的话题,如果单列去重,可以使用Unique函数完成,如果多列去重,如下图:从数据信息中可以看到,每位参赛者参加了多项运动,如果想知道去重后的参赛者有多少人,该...

Excel(WPS表格)函数Groupby,聚合统计,快速提高效率!

在前期的内容中,我们讲了很多的统计函数,如Sum系列、Average系列、Count系列、Rank系列等等……但如果用一个函数实现类似数据透视表的功能,就必须用Groupby函数,按指定字段进行聚合汇...

Excel新版本,IFS函数公式,太强大了!

我们举一个工作实例,现在需要计算业务员的奖励数据,右边是公司的奖励标准:在新版本的函数公式出来之前,我们需要使用IF函数公式来解决1、IF函数公式IF函数公式由三个参数组成,IF(判断条件,对的时候返...

Excel不用函数公式数据透视表,1秒完成多列项目汇总统计

如何将这里的多组数据进行汇总统计?每组数据当中一列是不同菜品,另一列就是该菜品的销售数量。如何进行汇总统计得到所有的菜品销售数量的求和、技术、平均、最大、最小值等数据?不用函数公式和数据透视表,一秒就...