百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂

moboyou 2025-05-15 19:40 27 浏览

一、拟合和回归的区别

拟合并不特指某一种方法,指的是对一些数据,按其规律方程化,比如把平面(一元)上一系列的离散点,用一条直线(线性)或光滑的曲线(非线性)连接起来,而其方程化的方法有很多,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,是其中一种最常见的拟合方法,还有指数平滑这样简单一些的方法,或者ARIMA,VAR,等等各种复杂一点的方法。

从离散点的角度看,它们都有靠近某条曲线的趋势,所以这些点都在朝曲线拟合,从曲线的角度看,那些离散点都在向自己靠拢,所以这些点都在回归到曲线。所以拟合表示离散点(可以拓展到高维特征)与某个曲线方程(可以拓展到模型)的偏差小(目标),回归表示如何找到这样的曲线方程或模型(方法

本文主要讲解拟合和回归这两个概念的区别和联系,对回归拟合的方法进行分类与总结,重点介绍了一元回归拟合的几种实现方法,关于多元回归拟合其实就是机器学习中的回归任务建模了,我后期会出案例分析!

二、回归拟合的分类

  • 采用回归的方法,拟合出自变量x和因变量y之间存在的关系(方程或模型):
    • 根据自变量数量,可以分为一元回归和多元回归;
    • 按照方法可以分为统计回归模型和机器学习回归模型;
    • 按照因变量的多少,可分为简单回归分析和多重回归分析;
    • 按照自变量和因变量之间的关系类型,可分为线性回归和非线性回归。

对于简单回归拟合(即只有一个因变量),可以进一步做以下分类:

  • 对于单自变量-----一元回归拟合
    • 一元线性回归拟合:y = ax + b
    • 一元非线性回归拟合:
      • 特征转化:通过应用非线性变换来改变特征的表示形式,比如取X的对数X’ = Ln(X),然后进行一元回归y=aX’
      • 多项式拟合:可以看成一种多元线性拟合,将其看为有n个特征的多元线性拟合, x为一个特征,x的平方为一个特征……
      • 其他函数拟合:指数函数、对数函数拟合等...
      • 机器学习拟合:采样神经网络(隐含层大于1)、树模型等进行拟合
  • 对于多自变量-------多元回归拟合
    • 多元线性回归拟合:y = a1x1 + a2x2 +a3x3 + ...
    • 多元非线性回归拟合(机器学习...)

三、一元线性回归拟合

准备数据

x=np.array([1,2,3,4,5,6.5,7,8])
y=np.array([1,4,9,13,30,25,49,70])

3.1 法一:np.polyfit

np.polyfit 是 NumPy 库中的一个函数,用于多项式拟合。它可以根据给定的数据点,拟合出一个多项式函数,返回拟合的系数。

a=np.polyfit(x,y,1)#用1次多项式拟合x,y数组
print(a)
b=np.poly1d(a)#拟合完之后用这个函数来生成多项式对象
print(b)
c=b(x)#生成多项式对象之后,就是获取x在这个多项式处的值
plt.scatter(x,y,marker='o',label='original datas')#对原始数据画散点图
plt.plot(x,c,ls='--',c='red',label='fitting with second-degree polynomial')#对拟合之后的数据,也就是x,c数组画图
plt.legend()
plt.show()

a是系数:[ 8.83917084 -15.20371694]

b是方程:8.839 x - 15.2

3.2 法二:sklearn里面的LinearRegression()

# 定义回归模型
reg = LinearRegression()
x = np.array(x).reshape((len(x), 1))
reg.fit(x, y)
print(reg.coef_)
print(reg.intercept_)
plt.plot(x, y, 'b.')
plt.plot(x, reg.predict(x),'r')
plt.show()

将一元视为多元回归的一种特殊情况,即只有一个特征。

系数:reg.coef_:[8.83917084]

截距:reg.intercept_:-15.203716940671903

3.3 法三:curve_fit

curve_fit 是 SciPy 库中的一个函数,用于非线性曲线拟合。它可以根据给定的数据点和一个自定义的模型函数,拟合出最优的参数值,并返回拟合的参数以及协方差矩阵。

# 定义一个一元线性方程,变量一定要放在第一个位置
def func(x, a, b):
    return a * x + b

popt, pcov = curve_fit(func, x, y)
print(popt)  # 参数最佳值
y2 = func(x, popt[0], popt[1])
plt.scatter(x, y, marker='x', lw=1, label='原始数据')
plt.plot(x, y2, c='r', label='拟合曲线')
plt.legend()  # 显示label
plt.show()

最佳系数:popt:[ 8.83917082 -15.20371685]

四、一元多项式回归拟合(以2次多项式为例)

准备数据

x=np.array([1,2,3,4,5,6.5,7,8])
y=np.array([1,4,9,13,30,25,49,70])

4.1 法一:np.polyfit

a=np.polyfit(x,y,2)#用2次多项式拟合x,y数组
print(a)
b=np.poly1d(a)#拟合完之后用这个函数来生成多项式对象
print(b)
c=b(x)#生成多项式对象之后,就是获取x在这个多项式处的值
plt.scatter(x,y,marker='o',label='original datas')#对原始数据画散点图
plt.plot(x,c,ls='--',c='red',label='fitting with second-degree polynomial')#对拟合之后的数据,也就是x,c数组画图
plt.legend()
plt.show()

系数:[ 1.34960956 -3.36567929 5.01148555]

4.2 法二:sklearn里面的LinearRegression()

# 定义多项式回归, degree的值可以调节多项式的特征
poly_reg = PolynomialFeatures(degree=2)
# 特征处理
x = np.array(x).reshape((len(x), 1))
x_poly = poly_reg.fit_transform(x)
print(x_poly)
# 定义回归模型
reg = LinearRegression()
reg.fit(x_poly, y)
print(reg.coef_)
print(reg.intercept_)
plt.plot(x, y, 'b.')
plt.plot(x, reg.predict(x_poly), 'r')
plt.show()

系数:[ 0. -3.36567929 1.34960956]

截距:5.011485554320338

4.3 法三:curve_fit

# 定义一个二次多项式,变量一定要放在第一个位置
def func(x, a, b, c):
    return a * x ** 2 + b*x + c

popt, pcov = curve_fit(func, x, y) 
print(popt)  
y2 = func(x, popt[0], popt[1])
plt.scatter(x, y, marker='x', lw=1, label='原始数据')
plt.plot(x, y2, c='r', label='拟合曲线')
plt.legend()  # 显示label
plt.show()

系数:[ 1.34960956 -3.36567929 5.01148555]

五、一元其他函数回归拟合(指数函数为例)

准备数据

x=np.array([1,2,3,4,5,6.5,7,8])
y=np.array([1,4,9,13,30,25,49,70])

5.1 法:curve_fit

# 自定义一个想拟合的目标函数,变量一定要放在第一个位置
def func(x, a, b):
    return a * np.exp(x * b)

popt, pcov = curve_fit(func, x, y) 
print(popt)  # 即参数最佳值
y2 = func(x, popt[0], popt[1])
plt.scatter(x, y, marker='x', lw=1, label='原始数据')
plt.plot(x, y2, c='r', label='拟合曲线')
plt.legend()  # 显示label
plt.show()

系数:[2.47762425 0.41535845]

好了,本篇内容就到这里,我们下期再见!需要数据集和源码的小伙伴可以关注联系我!

原文链接:

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂它

作者简介:

读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。

相关推荐

原神:“天理”是什么?至今还有很多玩家没搞明白

原神已经更新到层岩巨渊,关于提瓦特的秘密却越来越多。然而,直到今天还有很多玩家不明白天理以及天理维系者的关系。这并不怪大家,因为剧情里根本没提,只能靠玩家去猜。天理是什么?在看完渊下宫的剧情之后,不少...

《原神》爆火3年仍无竞品:它的“致命武器”竟不是开放世界?

#原神的最大特点是什么?#《原神》爆火3年仍无竞品:它的“致命武器”竟不是开放世界?【独家观察】2023年8月,《原神》4.0版本“枫丹”上线首日登顶68国畅销榜,这个现象级产品再次向行业抛出灵魂拷问...

原神:每个人都是氪金大佬?除非在梦里!或许还有一种方法

游戏中的笔杆王者,每日靠玩游戏过日子,玩网游也有20个年头,我有自己独特的见解,作为一个10年不脱坑的老玩家,如果文章写的有什么问题,请重喷!如果大家觉得好,请转发加点赞!非常感谢!原神每个人都是氪金...

原神:丝柯克,又传新消息!入池时间,武器确定!第八元素无了!

原神:丝柯克,又传新消息!入池时间,武器确定!第八元素无了!新角色丝柯克已经确定会在5.7版本入池!作为公子的师傅,早在公子14岁时,丝柯克就已经是一位畅行于深渊的剑客了,如今成为执行官的公子,却只希...

原神服务端架构搭建工具+环境配置资料

我是艾西,今天给大家分享一份详细的原神服务端结构资料教程,从服务端的获取到端口的使用以及安卓和ios的DAIL签名等一文让你明白怎么架设原神服务端,哪些工具资料又代表着什么意思(保姆级教学)Grass...

在原神里钓鱼,有人竟然用上了深度强化学习,还把它开源了

机器之心报道机器之心编辑部还愁在《原神》里钓不到鱼吗?这有一份迟到的提瓦特钓鱼指南。在游戏圈,你可以没有玩过,但一定听过《原神》。虽然这是一款口碑两极分化的游戏,但不得不承认《原神》是当前最为火热的游...

BetterGI:让原神游戏更便捷的自动化工具

技术背景BetterGI是一个基于计算机视觉技术的项目,旨在让原神游戏变得更加便捷。它利用视觉算法和模拟操作,实现了多种游戏内的自动化功能,帮助玩家节省时间和精力。实现步骤系统要求操作系统:Wind...

原神:2.6服务端泄露?9999纠缠之缘秒到账,米哈游跻身全球15强

首先,恭喜米哈游凭借原神跻身全球应用开发商第14名,这个榜单记录了全球开发商在iOS&GooglePlay综合收入前52名的数据,第一腾讯第二网易,字节跳动第7,米哈游则排14名。值得一提的是,这个...

观鸣潮1.3前瞻有感,《原神》是屎山代码?七个问题拷打米哈游!

哈喽大家好啊。前天看完鸣潮1.3直播后,感触良多啊。虽然我对1.3的前瞻内容觉得中规中矩,没有太满意,但是对面策划的态度让我看到了差距。所以今天来拷打一下原神。就是对比隔壁策划面对玩家的反馈,所回答的...

PHP中的九大缓存技术(php中的九大缓存技术是什么)

1、全页面静态化缓存也就是将页面全部生成html静态页面,用户访问时直接访问的静态页面,而不会去走php服务器解析的流程。此种方式,在CMS系统中比较常见,比如dedecms;一种比较常用的实现方式是...

使用PhpStorm将代码同步到开发环境

配置步骤1、选择Tools>Deployment>Configuration:2、选择SFTP:3、输入servername:4、配置SSHconfiguration:5、配置...

PM小技术:使用SAE发布在线Axure文档

俗话说,不会写代码的产品经理不是好的射鸡湿。关于产品经理与技术之间的微妙关系,扯开了讲可是长篇大论,比如知乎上这个问题:IT行业产品经理(尤其是创业的)需要懂技术吗?懂到什么程度?,以及这个:产品经...

PHP新手如何提高代码质量(php代码教程)

1.不要使用相对路径常常会看到:require_once('../../lib/some_>该方法有很多缺点:它首先查找指定的php包含路径,然后查找当前目录.因此会检查过多路径.如果该脚本...

PHP代码中常用的优化策略(php性能优化及安全策略)

1、如果能将类的方法定义成static,就尽量定义成static,它的速度会提升将近4倍。2、$row['id']的速度是$row[id]的7倍。3、echo比print快,并...

PHP 没你想的那么差(php ml)

PHP现在名声很糟糕,因为它曾经是“可怕”的。本文试着回答一些常见的关于PHP的断言,目的是向非技术人员解释,PHP并不像许多人所说的那么糟糕。它是不是鼓励糟糕的实践?不再是了。过去,许多开发者...