从实时数据库转战时序数据库,他陪伴 TDengine 从 1.0 走到 3.0

news/2024/7/5 5:00:03

关于采访嘉宾

在关胜亮的学生时代,“神童”这个称号如影随形,很多人初听时会觉得这个称谓略显夸张,有些人还会认为这是不是就是一种调侃,但是如果你听说过他的经历,就会理解这一称号的意义所在了。

受到教师母亲的影响,关胜亮从记事起就“长”在了教室后排,提前开启了启蒙教育,这也使得他在四周岁直接就读了一年级。尽管所在村庄的教育条件非常有限,他仍然凭借着优异的成绩,在 16 周岁就进入了中国科学技术大学化学物理系,并拿到学校和政府合计 13000 元的助学奖金。要知道,2001 年时科大和清北差距并不大,在关胜亮所在的吉林省被并称为“三校”。更有意义的是,他的求学故事给家乡燃起了一把希望之火,让教育观念薄弱的村里人发现“原来上学也是孩子可以选择的出路”。

进入大学后,彼时还是大一新生的关胜亮通过旁听招聘会,分析出了日后理科学生的工作出路,无非就是留校、研究所、出国几类,当时科大理科相关专业能够获得全额奖学金并出国的比例大约为 20% ~ 30%,似乎也是一个不错的选择,但在接触 C 语言和数据结构的课程后,他发现自己更喜欢坐在电脑旁边写点程序。就这样,关胜亮确定了自己的未来发展方向,并成功从化学物理系转到了新开设的软件工程系,开启了自己的“程序员”生涯。

与涛思结缘,始于一个“无奈之举”

对于关胜亮来说,当初选择数据库这个就业方向,其实纯粹就是一个“无奈之举”。

“我研究生就读于中科院计算所,专业是虚拟现实,本来最对口的方向是一直火到现在的游戏行业,为了一纸户口,我进入了一家做实时数据库的企业,它和时序数据库(Time Series Database)还不一样,只能存储当前时间的数据,历史数据是存储在其他系统的。就这样我一直做了很多年的实时数据库,一度觉得实时数据库是明日黄花了。”

虽然这在当时看起来并不是一个最佳选择,但人生也没有绝对正确的选择,机会总是留给善于思考且有所准备的人,关胜亮深谙这个道理。“选择赛道,其实是在考虑如何生产出一个能卖钱的产品,要相信硬核技术永远都不会过时,只有技术才能带来新的元素。因此,与其选择赛道不如沉淀自己,找到自己的核心竞争力在哪里,看准时机将创业风口与自身专长相结合,技术才是第一生产力。”

2017 年,从 360 过渡到只有几个人的创业公司涛思数据,他没有过多犹豫,在发现自己在时序数据、分布式方面的技术储备,以及在监控领域的业务储备,正好与这个产品完全匹配后,他欣然选择了加入。“我想和 Jeff(TDengine 创始人与核心研发陶建辉) 一起,开发出一个行业领先的数据库产品,重新点亮我的职业生涯,让我十余年的知识积累能够发挥出更大的作用。”

到现在,关胜亮加入涛思也有了 6 年时间,而在这 6 年时间中,他也确实将自己的所学毫无保留地倾注在了 TDengine 这款产品之中。

“在涛思数据,我就是一块砖,哪里需要哪里搬。我组织开发了 TDengine 从 1.0 到 2.0 再到 3.0 的所有迭代版本,哪个模块缺人手,我就会补充到哪里,不但做架构、管理,也写了很多代码。打开 Github 仓库,查看 TDengine 的贡献者(https://github.com/taosdata/TDengine/graphs/contributors),可以看到我是排在第一位的。”

从实时数据库转战时序数据库,他陪伴 TDengine 从 1.0 走到 3.0 - TDengine Database 时序数据库

可以说,职业生涯到现在为止,专注于 TDengine 的产品研发就是让关胜亮最有成就感的事情了。让他欣慰的是,在涛思人的共同努力下,TDengine 已经发展成为了国内顶级的时序数据库产品,在国际上也有了一定的影响力,同时也得到了广大开发者的认可——GitHub 上已经发展了两万多的 star(https://github.com/taosdata/TDengine)。

在 IT 技术不断发展的今天,用户要想实现一种功能,一定会有很多的待选方案,但想要在一定性能条件下去实现,选择就不多了。TDengine 之所以硬核,就在于超高性能的数据处理能力。“回想 TDengine 1.x 的版本,产品的稳定性还达不到很高的标准,但我们的首批种子客户依然坚定的选择了 TDengine,一方面是对国产自研软件的支持,另一方面就是市面上没有可用的替代品。”

这也直观地说明,物联网领域确实需要一个能够真正解决问题的时序数据存储引擎。而随着 TDengine 的发展,关胜亮在 6 年前做出的选择也已经“开花结果”。

与 TDengine 同行,技术更新与海外市场两手抓

作为一个基础软件,尤其是国产基础软件,发展难度是显而易见的,也因此,从选择加入 TDengine 的那一刻开始,关胜亮就做好了长期扎根打持久战的准备。

“数据库产品一定要靠丰富的应用场景,通过时间的沉淀和场景的打磨才能发展起来。好的数据库是用出来的,不是靠几个代码高手设计出来的,决定数据库企业未来的是有效用户和应用场景,我们要做的就是在真实的场景中解决用户的痛点问题。”

从这一点出发,TDengine 开启了核心代码完全开源的发展模式,获得了数以千计的真实用户场景,如关胜亮一般的 TDengine 技术人员在这些案例的基础上总结提炼,抽象出用户的真正需求,不断调整迭代产品,不受定制开发等短期利益诱惑,始终保证着将核心研发力量投入在产品的主线发展方向上。

“开源软件想要获得长期发展,成为一个企业敢用的产品,背后一定需要一个强力的组织支撑,用以保证软件的架构稳定,保证代码质量和测试覆盖,保证软件缺陷可以稳定且及时的得到处理,越是功能强大、架构复杂的 2B 软件越是如此。”

借助开源的力量,TDengine 发展了大量的用户,为便于和用户交流沟通,涛思数据目前已运营了 20 多个用户群,各个用户群日常都非常活跃。以 TDengine 3.0 为例,一经发布,每天就有 5~600 人安装试用 TDengine,不到两周的时间已经收集了 100 个优化建议,进一步推动着产品的快速迭代。

“有的竞品攻击我们,说 TDengine 迭代速度太快,产品怎么可能稳定。这种说法非常有意思,产品稳定与否,是和质量体系有关的,和迭代速度关系不大。没有用户的使用,不要说大版本的迭代,小版本的迭代都成了无源之水。在国内竞品把目光瞄准 TDengine 时,TDengine 已经把目光瞄准了全球。”

从联合创始人的身份出发,关胜亮表示 TDengine 接下来的发展道路也已经非常清晰了。“TDengine 在国内时序数据库领域已经有了一定的江湖地位,但是海外市场的拓展还很有限。随着 TDengine 3.0 稳定性和易用性逐步增加,我对海外市场非常有信心,中国 IT 产业约占全球市场的 20%,海外市场具备更大的发展空间。在 IoT 领域,TDengine 已经解决了基础的数据读写的问题,下一步就是引入时序数据分析,在更广阔的领域推动技术的发展。

再起航:继续“六”下去

发展 6 年,TDengine 也已经沉淀了几十万行代码了,在产品架构设计和演进上,关胜亮也有着“经验之谈”。“在做开发之前,一定要考虑是在做一个产品,还是在做一个项目。作为项目,你可以选择一些主流的开源产品,不要过度设计,让项目可以快速上线;但作为一个产品,关键部分还是要以自研为主,控制核心代码,让迭代升级快速有效。”

他以 TDengine 为例进行了说明,“一个设备一张表的数据模型,作为其最核心的创新点,在三个大版本迭代时都没有变化;但是在工程实现方面,其元数据管理模块,从 1.0 的集中式管理,到 2.0 的半分布式管理,再到 3.0 的全分布式管理,完全是业务需求驱动的。集中式管理可以处理百万时间线,半分布式管理可以处理千万时间线,而全分布式则可以处理上亿的时间线,彻底解决了业界困扰的高基数问题。

从他的陈述中我们可以看到,TDengine 从 1.0、2.0 到 3.0 的演进,不是简单的数字堆积,每个版本都是真真正正的质的提升。它的成功不只是技术实现细节,更在于研发人员对时序数据特点的抽象融合,对于物联网业务的深度理解。

行文至此,关胜亮与 TDengine 的第一个六年故事就告一段落了,而他们的下一个六年也已经起航。对于关胜亮来说,他的终极目标就是让 TDengine 成为时序数据领域的事实标准,成为全球第一的时序数据库,而他也将为此继续奋斗在产品第一线。


了解更多 TDengine Database的具体细节,可在GitHub上查看相关源代码。


http://lihuaxi.xjx100.cn/news/1693127.html

相关文章

React之引入css的方式

一、是什么 组件式开发选择合适的css解决方案尤为重要 通常会遵循以下规则: 可以编写局部css,不会随意污染其他组件内的原生;可以编写动态的css,可以获取当前组件的一些状态,根据状态的变化生成不同的css样式&#…

2023 1019 广州akw,笔试,SPC软件工程师

1. 共用体 共用体的出现主要是为了解决以下两个主要痛点: 内存节省:在一些编程场景中,需要存储多种不同数据类型的数据,但不一定需要同时存储所有这些数据。如果使用独立的变量或结构体来表示这些数据,会浪费内存空间…

在js中常见的时间格式及其转换

在计算机编程中,常见的时间格式有以下几种: 1:ISO 8601 格式:国际标准的日期和时间表示方法。 格式为 “YYYY-MM-DDTHH:mm:ss.sssZ”,其中 “T” 是日期和时间的分隔符,“Z” 表示时区。 例如,…

使用kubekey部署k8s集群和kubesphere、在已有k8s集群上部署kubesphere

目录 前言什么是kubekey(简称kk)单节点上安装 kubesphere(all in one 快速熟悉kubesphere)部署 kubernetes和和kubesphere 多节点安装部署 kubernetes和和kubesphere 离线安装k8s v1.22.17和kubesphere v3.3.2联网-在已有k8s集群上…

JAVA-分布式锁

今天给大家带来一个项目中单模块加锁的方法 原理是通过springAOP前后置任务对需要调用的方法加锁,不懂aop的可以先去学习一下aop,这里就直接上锁代码了 //配置文件还没配置package com.cfood.order.aop;import io.lettuce.core.RedisClient; import org…

DAC8563数模转换模块的使用介绍

前言 DAC8563为16位低功耗、电压输出、双通道的数模转换器,其包括一个2.5V4ppm/C 内部基准,从而提供了一个 2.5V 或 5V 的满量程输出电压范围。 此内部基准有一精度,并且能够在 VREFIN/VREFOUT引脚上提供或吸收高个 5mV 的初始达 20mA 的电流…

Go 存储系列:LSM存储引擎 LevelDB

概念介绍 LSM-Tree 被是一种面向写多读少应用场景的数据结构 ,被 Hbase、RocksDB 等强力 NoSQL 数据库采用作为底层文件组织方式。 简单的LSM-Tree 包含 2 层树状数据结构: Memtable 并完全驻留在内存中(假设 T0) SStables 存储…

2、Flowable基础表结构

Flowable基础表结构 1.表结构讲解 工作流程的相关操作都是操作存储在对应的表结构中,为了能更好的弄清楚Flowable的实现原理和细节,我们有必要先弄清楚Flowable的相关表结构及其作用。在Flowable中的表结构在初始化的时候会创建五类表结构,具…