Java、Go 和 Python 多线程性能对比
moboyou 2025-06-07 16:57 46 浏览
大家好,我是难瓜。
今天分享多线程下这三门语言的表现。
简介
在计算机中,线程是可以由处理器独立执行的小指令序列。多线程在一个进程中是可能的,其中它们共享资源,例如指令和上下文。
发现在运行多线程进程时效率最高的编程语言非常重要,因为它可以帮助软件开发人员同时选择最有利的语言来实现他们的系统。
本文的目的是分析和比较 Java、Go 和 Python 使用它们的并行工具解决几种算法的性能,例如:Java 和 Python 的线程,以及 Go 的 goroutine。为了评估性能,我们编写了经典矩阵乘法算法、快速排序算法和康威生存游戏(Conway’s game of life)的并行实现。
背景
Java:它是一种面向对象的编程语言,通过Thread类、Runnable接口和java.util.concurrent包中包含的其他功能内置支持并发。
Go:它是谷歌在 2012 年前发布的一种编程语言。它是一种类似于 C 的语言,并且具有垃圾收集器和内置的并发支持。对于并发性和并行性,Go 使用称为 goroutines 的线程实现。它使用内置的调度程序在后台处理线程,并试图向用户隐藏通常线程管理的大部分复杂性,以支持简单地指定要运行的函数并使用 go 命令为它们开头。Go 在幕后使用操作系统 (OS) 线程。
Python:标准库 threading,这个模块封装了线程,提供了一个干净的接口来处理它们。在这种方法中,操作系统实际上知道每个线程,并且可以随时中断它以开始运行不同的线程。使用 Python 的其他标准库(称为 multiprocessing)可以在 Python 实现并行性,而 multiprocessing 会创建新的进程。threading 模块使用线程,multiprocessing 模块使用进程。不同之处之一是线程在相同的内存空间中运行,而进程具有单独的内存。
矩阵乘法:它是线性代数中一个重要而简单的数学运算,经典的矩阵乘法算法(CMMA)可以很容易地用任何编程语言实现。CMMA 时间复杂度 *O(N^3)*,其中 N 是矩阵的维度。
快速排序:它是一种分而治之的算法。最初,它将数组拆分为两个子数组:分别是较低的项和较高的项。然后它递归地对这些数组进行排序。其算法可以描述为:
- 从数组中选择一个枢轴元素。
- 对数组进行分区,使得枢轴左侧的所有元素的值都小于枢轴的值,而枢轴右侧的所有元素的值都大于枢轴的值。
- 对生成的子数组递归执行上述步骤,直到得到完全排序的子数组。
它的平均排序复杂度为*O(nlog(n)) ,但在极少数情况下会降级为 O(n^2)*。
康威的生存游戏:它是由剑桥大学冈维尔和凯斯学院的数学家约翰霍顿康威在 60 年代开发的。规则是:
- 规则 1 生存:如果一个活细胞有两个或三个活的邻居,它就可以生存。
- 规则 2 死亡:如果一个活细胞的存活邻居少于两个或多于三个,它就会死亡。
- 规则 3 出生:如果一个死细胞恰好有三个活着的邻居,它就会出生。
下图片显示了康威生存游戏从时间 T 到时间 T + 2 的几个场景。该算法的一个简单实现将检查每一步的每个单元格,其时间复杂度为 O(M × N ) ,其中 M 表示行数, N 表示网格的列数。
It shows several scenarios of Conway’s game of life from time T to time T + 2
解决方案
所有基准测试都在同一台计算机和同一环境中执行。 表 I 显示了我们进行实验的硬件规格,表 II 显示了每种语言编程编译器的版本
硬件和编程语言软件概览
对于每个基准,我们计算其各自的加速和效率。加速度定义为最佳时间与速度 p 个处理器的并行时间之比: S = T1/Tp 。那么效率定义为:并行系统中每个处理器的总体利用率: E = S/p 。
矩阵乘法:在本实验中,我们使用由 C = AB 计算的简单矩阵乘法。矩阵的大小为 512 × 512。我们正在运行一个顺序场景,然后是几个线程池大小为:2、4、8、16 和 32 个线程的多线程场景。相同的矩阵 A 和 B 用于运行 Java、Go 和 Python 中的代码。这些矩阵将具有从 0 到 1000 的整数值(包括 0 到 1000)。线程池将接收 n 工作人员,表示矩阵 A 中的行数,然后每个线程将执行该特定行的乘法,并更新 C中的相应行 与得到的结果。每次线程完成其工作时,它将从线程池接收新的分配,直到所有工作都完成。下图说明了矩阵 C 的计算。
矩阵乘法
快速排序:我们从 0 到 10^7(包括 0 和 10^7)对 10^7 个整数值的数组进行排序。我们使用 ForkJoinPool 方法来解决这个实验。执行顺序运行,然后多线程测试以 2 的幂从 2 到 32 个线程。这 3 个实现对同一个数组进行排序。在快速排序的并行实现中,分区后新子序列的排序可以并行执行,因为没有冲突。
康威生存游戏:康威生存游戏中有几个初始已知模式会产生预期的结果,有一个会无限增长,下一张图像的左侧显示其初始设置。在这个基准测试中,我们定义了一个 28 × 28 的 2D 网格,其中 4 个先前的模式彼此相邻,并在 20,000 代期间执行游戏,该网格看起来像下图的右侧。
无限增长模式
对于这个实验,我们重复线程池方法,它将处理 2、4、8、16 和 32 个线程。此外,我们运行顺序实现。我们并行应用了决定细胞在每一代中是否继续生存、死亡或重生的规则。此外,为了获取单元格的邻居,我们不会将网格视为无限网格,如果单元格的邻居在世界范围之外,则认为它已死。
结果
矩阵乘法:表 III 显示了运行矩阵乘法基准后获得的结果。Java 是顺序执行中最好的,它在 316 毫秒内运行了 512 × 512 矩阵乘法,而 Go 消耗了 453 毫秒,这代表顺序运行的时间增加了 43.35%。性能最差的是 Python,它使用了 93,870 毫秒(93.87 秒),相差约 29,600%。
此外,在表 III 中可以看出,当使用 2 个线程执行基准测试时,Java 性能更好,但是当实验在 4、8 和 16 个线程中运行时,Go 优于 Java 和 Python。我们可以在 32 个线程的阈值处检测到性能下降,这可能是由于创建过多线程的开销超过了 CPU 中的物理内核;即使在这种恶化的情况下,Go 的性能也优于其他两种语言。
矩阵乘法时间消耗(以毫秒为单位)。越低越好。
下图的左侧反映了对于 Go,从 2 到 4 个线程的性能差异是显着的(大约 92% 的改进),而从 8 到 16 个线程它是微不足道的,因为图中的曲线几乎保持不变,这说明我们认为 8 个线程对于这个特定场景来说是一个很好的数字。另一方面,Java 的性能从 2 个线程稳步增加到 16 个线程;从这个图中,我们可以选择 16 个线程作为大量线程,以便在 Java 中获得不错的性能。从下图右侧可以确定,资源利用效率最差的是Python,最好的是Go。
矩阵乘法的加速和效率。
快速排序:在表 IV 中,我们可以看到 Go 在测试的顺序运行中获得最佳性能,而 Python 最差。Python 实现的一般行为非常糟糕,在 16 和 32 线程的情况下,应用程序无法完成执行(DNF 代表没有完成)卡住并阻塞计算机。Go 提供了有趣的结果,因为多线程运行从糟糕到最差的性能。对于这个度量,Java 获得了最好的多线程结果,但是在 16 和 32 线程的运行中,我们可以发现性能下降,其中 16 线程的性能最差。
快速排序时间消耗(以毫秒为单位)。越低越好。
下图左侧的加速表明,当使用 Java 实现时,使用超过 8 个线程运行快速排序算法是没有意义的。此外,我们可以看到 32 线程的运行比 16 线程的运行好一点,但比 8 线程的运行差。该图反映了 Go 多线程实现不如顺序实现。即使 Python 的性能很差,使用 2、4 和 8 个线程的运行也比顺序运行要好。
下图右侧反映的效率证实了我们在表 IV 中看到的最好的,但不是最差的,因为这个图可以让我们认为 Python 比 Go 更好,但是时间的消耗告诉我们一段不同的历史:Go 的表现优于 Python。
快速排序的加速和效率。
康威的生存游戏:Python 再次获得了所有 3 种实现中最差的结果,但是正如我们在表 V 中看到的,它是唯一一个从顺序实现到多线程实现有一些改进的版本;尽管如此,随着线程数量的增加,时间的消耗也会增加。在 Java 和 Go 的情况下,它们的最佳性能来自顺序实现。在 Java 场景中,从顺序版本到具有 32 个线程的版本的时间差异为 11,455%,这代表了当时的巨大差距。在 Java 实现中,每一代之后都会释放线程池并创建一个新的线程池,这会产生相当大的开销。Go 行为不稳定,时间利用率从顺序到 2 线程版本增加,然后在 4、8 和 16 个线程的版本中,它会稍微减少一点,最后在 32 个线程时,它会再次增加。
康威的生存时间消耗游戏(以毫秒为单位)。越低越好。
下图的加速图证实了康威生存游戏的多线程实现的一般性能很差。围绕加速曲线的期望是它应该遵循增加的行为,而这并没有发生。报告的效率表明资源没有得到适当的利用。Java 的效率非常接近于零,Go 和 Java 之间只有一点点差异。
康威生存游戏的加速和效率。
结论
创建线程的开销直接影响应用程序的性能。在表 III 中可以看出,在达到某个阈值后继续创建线程是没有意义的,因为性能会下降。
如表 V 所示,使用多线程解决问题并不能保证我们会获得更好的性能,有时顺序实现是最好的选择。
处理并发性和并行性的 Python 标准库不如 Java 和 Go 等其他编程语言中实现的标准库。
很难说 Java 和 Go 之间哪个更好,因为 Java 在矩阵乘法基准测试中优于 Go,但 Go 在快速排序实验中超过了 Java。
未来的工作
这项工作仅限于每个算法的基本实现,下一步将是复制本研究引入的场景,但使用每个基准测试的最知名实现。
在 Python 中实现并行代码有多种选择,例如:MPI for Python、CharmPy、Numba 等。一个好的实验是使用这个库用更有效的实现来替换书面代码。
扩展这项研究的一种方法是考虑其他技术方面,例如编译时间、文件大小和编写的代码行数。
相关推荐
- Excel技巧:SHEETSNA函数一键提取所有工作表名称批量生产目录
-
首先介绍一下此函数:SHEETSNAME函数用于获取工作表的名称,有三个可选参数。语法:=SHEETSNAME([参照区域],[结果方向],[工作表范围])(参照区域,可选。给出参照,只返回参照单元格...
- Excel HOUR函数:“小时”提取器_excel+hour函数提取器怎么用
-
一、函数概述HOUR函数是Excel中用于提取时间值小时部分的日期时间函数,返回0(12:00AM)到23(11:00PM)之间的整数。该函数在时间数据分析、考勤统计、日程安排等场景中应用广泛。语...
- Filter+Search信息管理不再难|多条件|模糊查找|Excel函数应用
-
原创版权所有介绍一个信息管理系统,要求可以实现:多条件、模糊查找,手动输入的内容能去空格。先看效果,如下图动画演示这样的一个效果要怎样实现呢?本文所用函数有Filter和Search。先用filter...
- FILTER函数介绍及经典用法12:FILTER+切片器的应用
-
EXCEL函数技巧:FILTER经典用法12。FILTER+切片器制作筛选按钮。FILTER的函数的经典用法12是用FILTER的函数和切片器制作一个筛选按钮。像左边的原始数据,右边想要制作一...
- office办公应用网站推荐_office办公软件大全
-
以下是针对Office办公应用(Word/Excel/PPT等)的免费学习网站推荐,涵盖官方教程、综合平台及垂直领域资源,适合不同学习需求:一、官方权威资源1.微软Office官方培训...
- WPS/Excel职场办公最常用的60个函数大全(含卡片),效率翻倍!
-
办公最常用的60个函数大全:从入门到精通,效率翻倍!在职场中,WPS/Excel几乎是每个人都离不开的工具,而函数则是其灵魂。掌握常用的函数,不仅能大幅提升工作效率,还能让你在数据处理、报表分析、自动...
- 收藏|查找神器Xlookup全集|一篇就够|Excel函数|图解教程
-
原创版权所有全程图解,方便阅读,内容比较多,请先收藏!Xlookup是Vlookup的升级函数,解决了Vlookup的所有缺点,可以完全取代Vlookup,学完本文后你将可以应对所有的查找难题,内容...
- 批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数
-
批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数在电商运营、物流对账等工作中,经常需要统计快递“揽收到签收”的耗时——比如判断某快递公司是否符合“3天内送达”的服务承...
- Excel函数公式教程(490个实例详解)
-
Excel函数公式教程(490个实例详解)管理层的财务人员为什么那么厉害?就是因为他们精通excel技能!财务人员在日常工作中,经常会用到Excel财务函数公式,比如财务报表分析、工资核算、库存管理等...
- Excel(WPS表格)Tocol函数应用技巧案例解读,建议收藏备用!
-
工作中,经常需要从多个单元格区域中提取唯一值,如体育赛事报名信息中提取唯一的参赛者信息等,此时如果复制粘贴然后去重,效率就会很低。如果能合理利用Tocol函数,将会极大地提高工作效率。一、功能及语法结...
- Excel中的SCAN函数公式,把计算过程理清,你就会了
-
Excel新版本里面,除了出现非常好用的xlookup,Filter公式之外,还更新一批自定义函数,可以像写代码一样写公式其中SCAN函数公式,也非常强大,它是一个循环函数,今天来了解这个函数公式的计...
- Excel(WPS表格)中多列去重就用Tocol+Unique组合函数,简单高效
-
在数据的分析和处理中,“去重”一直是绕不开的话题,如果单列去重,可以使用Unique函数完成,如果多列去重,如下图:从数据信息中可以看到,每位参赛者参加了多项运动,如果想知道去重后的参赛者有多少人,该...
- Excel(WPS表格)函数Groupby,聚合统计,快速提高效率!
-
在前期的内容中,我们讲了很多的统计函数,如Sum系列、Average系列、Count系列、Rank系列等等……但如果用一个函数实现类似数据透视表的功能,就必须用Groupby函数,按指定字段进行聚合汇...
- Excel新版本,IFS函数公式,太强大了!
-
我们举一个工作实例,现在需要计算业务员的奖励数据,右边是公司的奖励标准:在新版本的函数公式出来之前,我们需要使用IF函数公式来解决1、IF函数公式IF函数公式由三个参数组成,IF(判断条件,对的时候返...
- Excel不用函数公式数据透视表,1秒完成多列项目汇总统计
-
如何将这里的多组数据进行汇总统计?每组数据当中一列是不同菜品,另一列就是该菜品的销售数量。如何进行汇总统计得到所有的菜品销售数量的求和、技术、平均、最大、最小值等数据?不用函数公式和数据透视表,一秒就...
- 一周热门
- 最近发表
-
- Excel技巧:SHEETSNA函数一键提取所有工作表名称批量生产目录
- Excel HOUR函数:“小时”提取器_excel+hour函数提取器怎么用
- Filter+Search信息管理不再难|多条件|模糊查找|Excel函数应用
- FILTER函数介绍及经典用法12:FILTER+切片器的应用
- office办公应用网站推荐_office办公软件大全
- WPS/Excel职场办公最常用的60个函数大全(含卡片),效率翻倍!
- 收藏|查找神器Xlookup全集|一篇就够|Excel函数|图解教程
- 批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数
- Excel函数公式教程(490个实例详解)
- Excel(WPS表格)Tocol函数应用技巧案例解读,建议收藏备用!
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)
- linux有没有pe工具 (34)
- 可以上传视频的网站源码 (25)
- 随机函数如何生成小数点数字 (31)
- 随机函数excel公式总和不变30个数据随机 (33)
- 所有excel函数公式大全讲解 (22)
- 有动图演示excel函数公式大全讲解 (32)
