从四种时序数据库选型脱颖而出,TDengine在工控边缘侧的应用
moboyou 2025-03-28 13:17 35 浏览
作者:冰茹
小 T 导读:和利时始创于 1993 年,业务集中在工业自动化、交通自动化和医疗大健康三大领域,结合自动化与信息化两方面的技术优势,提出了“智能控制、智慧管理、自主可控、安全可信”的战略指导方针。围绕集团三大业务,公司对工业互联网、大数据、5G、信息安全等新兴技术开展更深入的研究和应用示范,打造面向各领域应用的工业互联网平台,进一步促进智能制造解决方案的落地应用。
在物联网场景下,面对庞大的时序数据处理需求,Oracle、PostgreSQL 等传统关系型数据库越来越吃力。基于此,目前国内外主流工业互联网平台几乎都已经采用时序数据库,来承接海量涌入的工业数据。
究其原因,可以从数据的三个核心需求来解释。我们都知道,企业在选择数据库、文件系统等产品时,最终目的都是为了以最佳性价比来满足数据的三个核心需求:数据写入、数据读取、数据存储。时序数据库完全是按照时序数据的三个需求特征进行设计和开发的,在数据处理上更加具有针对性:
- 在数据写入上,如果将时间看作一个主坐标轴,时序数据通常是按照时间顺序抵达,抵达的数据几乎总是作为新条目被记录,在数据处理操作上 95%-99%都是写入操作;
- 在数据读取上,随机位置的单个测量读取、删除操作几乎没有,读取和删除都是批量的,从某时间点开始的一段时间内读取的数据可能非常巨大;
- 在数据存储上,时序数据结构简单,价值随时间推移迅速降低,通常都是通过压缩、移动、删除等手段来降低存储成本。
而关系型数据库主要应对的数据特点却大相径庭:
- 数据写入:大多数操作都是 DML 操作,插入、更新、删除等
- 数据读取:读取逻辑一般都比较复杂
- 数据存储:很少压缩,一般也不设置数据生命周期管理
因此,从数据本质的角度而言,时序数据库(不变性、唯一性以及可排序性)和关系型数据库的服务需求完全不同。这也是我们一开始就锁定时序数据库来满足工业互联网场景的核心原因。
一、时序数据库选型
我们对包括 InfluxDB、OpenTSDB、HolliTSDB(和利时自研时序数据库)、TDengine 在内的四款时序数据库进行了选型调研及相关测试。测试数据的频率为 1 秒钟,数据集包含 10000 台设备,每台设备有 10000 条记录,每条数据采集记录包含 3 个标签字段、2 个数据字段、1 个时间戳字段。测试对比项包括占用磁盘空间、百万条数据遍历查询、聚合查询(COUNT、AVG、SUM、MAX、MIN)。测试结果如下所示:
- 占用磁盘空间
- 百万条数据遍历查询
- 聚合查询 COUNT
- 聚合查询 AVG
- 聚合查询 SUM
- 聚合查询 MAX
- 聚合查询 MIN
同等条件下,TDengine 的压缩率最高,数据占用的存储空间最小;在原始数据查询上,OpenTSDB 最慢,TDengine 与 HolliTSDB 在伯仲之间;在聚合查询操作上,TDengine 最快,HolliTSDB 的速度和 InfluxDB 相当,OpenTSDB 最慢。同时,InfluxDB 只能单机部署,集群版本并未开源,且查询性能存在瓶颈,其 QPS 约为 30-50。
从性能测试结果来看,我们选择 TDengine 的原因主要源于以下几点:
- TDengine 在查询性能维度上的表现非常优异,满足了我们的业务查询需求
- 集群功能开源,方便横向扩展,更弹性
- 在开源热潮之下,支持如 TDengine 一般的国产开源数据库、操作系统、中间件等也是企业的必修课
最终我们决定接入 TDengine,以享受更多元的本地化支持和响应。
二、技术架构与实现
目前 TDengine 作为边缘版时序数据库在搭建使用,具体的技术架构如下图所示:
基于 TDengine 进行建库建表思路如下:
CREATE STABLE IF NOT EXISTS ts_super
(time TIMESTAMP, s BIGINT, vl BIGINT,vf DOUBLE,vb BOOL,vs BINARY(16349))
TAGS
(innerId BIGINT, namespace BINARY(256), id BINARY(256), type BINARY(1), seq int);
在构建列时,包含元素为 time(时间,主键)、s(数据质量)、vl(整形类型数据 L)、vf(浮点型数据 F)、vb(布尔型数据 B)、vs(字符串数据 S),其中 time、s 是必填的列,剩余列则要根据测点类型填写,比如测点上报的是整形数据,就只需要设置 time、s、vl 这三列,vf、vb、vs 这三列为 null。
在构建 tag 时,要包括 innerId(测点内部编码)、id(测点 id)、type(测点类型,L/F/B/S)、seq (序号,L/F/B 类型数据设置为 0,S 类型测点的 seq 可能为 0,1,2,3...)
同时,在建库建表的操作中我们也碰到了一些小问题,放在这里给大家做下参考:
- 因为表名不支持特殊字符,所以需要再生成一个唯一编码作为表名;
- 查询语句会被填充,导致查询过程性能变慢,网卡被打满。这种情况下只需要将查询请求手动压缩,就能有效降低带宽占用率;
- TDengine 字符串最长可以有 16374 字节 ,超过的话需要从逻辑上处理。我们采用的方案是如果长度超过 16374 ,截取该字符串,同一个测点再建新的表,通过 tag 关联。
三、实际效果展示
1. 数据库配置
TDengine 集群 5 个节点,副本数设置为 3。修改配置为:
- minTablesPerVnode 10
- tableIncStepPerVnode 10
- compressMsgSize 1024
- rpcForceTcp 1
- httpMaxThreads 16
各节点机器配置如下:
2. 查询客户端配置
客户端共有三台主机,每台主机上分别运行时序查询及其对应的 AB,各主机上的时序查询独立运行,分别启动一/二/三个时序查询及其对应的 AB 进行性能测试。
3. 数据说明
共 1000 个测点,80000 万条数据,数据频率为每秒钟 1 条。存储分布如下所示,存储压缩率不超过 1/10。
4. 查询结果
在我们的业务查询当中,增加 QPS 的主要方式是增加查询的并发数。AB 从 1 到 2,QPS 增加了 45%,平均响应时间不超过 1000ms,很好满足了客户需求。
5. 资源消耗(统计 3 个查询服务的实例)
- TDengine node 节点资源消耗
在查询过程中,数据是相对均匀的分布,但是不同节点的 CPU 消耗仍然有较大的方差。这是由于 TDengine 的 RESTful 的底层是在服务端通过单独的代理线程作为客户端查询,所以会受到请求均匀度的影响。如果 TDengine 在后续可以做代理层面的负载均衡,相信能够缩小这个偏差。
6. 查询服务资源消耗
在查询段的节点资源消耗还是相当大的,因为需要对查询请求和结果进行处理。在具体业务中,可以考虑使用 RPC 接口来降低查询服务的 CPU 消耗。
四、写在最后
TDengine 在本项目中展现出的性能效果非常显著,推动本次项目快速且高质量落地,实现降本增效的目标。接下来,希望 TDengine 能够在以下两个方向上有更大的进步,也祝愿我们的合作能够越来越紧密:
- 希望可以通过触发器或协处理器等方式,在服务端做数据过滤再返回,解决网络压力过大的问题
- 希望能够进一步改善长度限制的问题
查看博客: 你写,我“奖”|TDengine 用户故事征集 | 涛思数据活动详情,
iPhone 13 Pro 等你带回家!
相关推荐
- php通过IP地址查询详细信息_php根据ip获取位置
-
前言:以前找过很多查询ip地址信息的工具,有的没有经纬度,有的没有国外的信息。现在本人制作的这个可以查询全国ip的信息,并且给出ip地址所在地的经纬度信息!以下为php程序代码截图...
- 今晚拿下PHP反序列化的一系列操作
-
引言在CTF中反序列化类型的题目还是比较常见的,之前有学习过简单的反序列化,以及简单pop链的构造。这次学习内容为php内置的原生类的反序列化以及一点进阶知识。在题目给的的代码中找不到可利用的类时,这...
- 关于 PHP 启动 MongoDb 找不到指定模块问题
-
前言:最近有一个小demo,需要通过PHP将用户行为记录储存到MongoDB,再用Spark做协同过滤。由于以前处理跨语言交互是通过消息中间件,这次本地使用MongoDB却弄出了几个问...
- PHP8中查询数组中指定元素-PHP8知识详解
-
php是使用最广泛的web编程语言,数组是一个数据集合,数组是一种非常常用的数据类型。在操作数组时,有时我们需要查询数组中是否有某个指定元素。在实际的程序开发中,我们用到了下列方法来查询数组中指定的元...
- 通过代码执行或命令执行写Shell_命令执行和代码执行
-
公众号:白帽子左一专注分享渗透经验,干货技巧...本文由团队手电筒分享,如果你还是个小白担心看不懂,没关系,“三步写马””如何上传木马”“如何拿下服务器并妥善管理”等实战内容可以结合视频观看,视频演示...
- ThinkPHP6初步搭建API服务_thinkphp6 api
-
ThinkPHP6正式发布已有一小段时间,按照官方文档实操了一遍。中间也遇到些小问题,在网上找解决方案花费了一些时间。本次分享整理了ThinkPHP6从头开始部署的详细操作步骤,希望能够帮助大家节省探...
- 第②章 在逃火锅难民与椒盐喷嚏_椒盐蛋解说我的世界
-
意识像沉在深海的破船,一点一点被光线和声音打捞上来。林琳,不,现在是李琳琅了,躺在宽大得能跑马的雕花拔步床上,瞪着头顶繁复的藻井彩绘,第无数次确认自己不是在做梦。鼻腔里充斥着淡淡的、混合了药味、熏...
- 美团外卖特征平台的建设与实践_美团外卖的技术分析
-
随着美团外卖业务的发展,算法模型也在不断演进迭代中。本文从特征框架演进、特征生产、特征获取计算以及训练样本生成四个方面介绍了美团外卖特征平台在建设与实践中的思考和优化思路。1背景美团外卖业务种类繁多...
- 分库分表实战(第2期):最初的我们——了解一下单库外卖订单系统
-
前言上一期内容我们整体了解了分库分表实战项目当前使用的系统架构,也就是单库版本订单系统的系统架构。同时,我们也知道了未来要做的分库分表版本的订单系统架构。现在,我们就从单库版本的订单系统开始,一步一...
- “美团外卖小哥帮崩溃程序员写代码”视频遭质疑:自编自导自演
-
来源:三言财经近日,有网友质疑走红网络的“青岛外卖小哥帮崩溃程序员写代码”的视频是一起策划。有网友认为,就算是行业人员转行送外卖,一上手就能看懂对方的代码并开始马上写的行为太假;还有网友表示,配音搞成...
- HarmonyOS NEXT仓颉开发语言实战案例:外卖App
-
各位周末好,今天为大家来仓颉语言外卖App的实战分享。我们可以先分析一下页面的布局结构,它是由导航栏和List容器组成的。幽蓝君目前依然没有找到仓颉语言导航栏的系统组件,还是要自定义,这个导航栏有三部...
- 基于微信小程序的外卖点餐的设计与实现-计算机毕业设计源码
-
摘要随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了微信小程序外卖点餐的设计与实现的开发全过程。通过分析微信小程序外卖点餐的设计与实现管理的不足,创建了一个...
- 外卖源码和外卖平台系统租赁有什么区别?
-
外卖源码和外卖平台系统租赁是两种不同的模式,它们之间有什么区别?我们来看看吧。1.概念不同:外卖源码是指一种软件源代码,包括了外卖平台的核心代码、框架、功能模块等,需要用户自己进行二次开发和定制。更...
- Java项目本地部署宝塔搭建实战java外卖小程序源码
-
大家好啊,我是测评君,欢迎来到web测评。本期给大家带来一套java开发的外卖小程序源码,这套系统已经完成了线下配送的大部分功能,适合学习与二次开发。技术架构技术框架:springboot+ssm...
- 一周热门
- 最近发表
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)
- linux有没有pe工具 (34)
- mysql数据库源码 (21)
- php开源万能表单系统源码 (21)
- 可以上传视频的网站源码 (25)