时序数据库学习一:什么是时序数据库

温馨提示：

本文最后更新于 2022年05月26日，已超过 1,484 天没有更新。若文章内的图片失效（无法正常加载），请留言反馈或直接联系我。

时序数据库

时序数据库全称为时间序列数据库。时间序列数据库指主要用于处理带时间标签（按照时间的顺序变化，即时间序列化）的数据，带时间标签的数据也称为时间序列数据。

时间序列数据主要由电力行业、化工行业、气象行业、地理信息等各类型实时监测、检查与分析设备所采集、产生的数据，这些工业数据的典型特点是：产生频率快（每一个监测点一秒钟内可产生多条数据）、严重依赖于采集时间（每一条数据均要求对应唯一的时间）、测点多信息量大（常规的实时监测系统均有成千上万的监测点，监测点每秒钟都产生数据，每天产生几十GB的数据量）

时序数据的特征

1:持续产生海量数据,没有波峰波谷

2:每条数据都带有时间戳

3:数据不可变,只会一直添加

4:高效的存储压缩效率

5:时序唯一性:某一个时刻的某一个指标只会有一条(一组也视为一条)数据

6:单条数据没有意义,看某一个时间段的所有数据才有意义

时序数据库的基本概念

Time series

（时间序列，简称时序或者时序数据）：根据wiki百科[2]，其数学定义是这样：In mathematics, a time series is a series of data points indexed (or listed or graphed) in time order. Most commonly, a time series is a sequence taken at successive equally spaced points in time. Thus it is a sequence of discrete-time data. 翻译过来的要点就是 1）源于数学学科； 2）是按时间顺序索引的一系列数据点。因此也多翻译为“时序数据”。3）最常见的是在连续的相等间隔时间点上获取的序列。4）是一个离散时间的数据序列。

Metric（度量指标）

在软件领域，Metric是对软件或其规格的某些属性的度量。在wiki百科中有这样的阐述：software metric[3]是衡量软件系统或过程具有某种属性的程度的标准。尽管学术界最初认为Metric是函数（function），Measurement是通过应用metric获得的数值；但随着计算机学科和传统学科的借鉴融合，这两个术语通常也用作同义词，泛指同一个东西了。

时序数据库的项目

事实上，业界流行的ClickHouse、Apache IoTDB等也属于时序数据库范畴。本文从应用运维场景，对众多的TSDB做个初步分析和筛选出典型代表产品，方便后面进行针对性的对比分析。

InfluxDB：排名第一，社区火热和国内外采用厂商比较多。
Prometheus：属于CNCF基金会第二个毕业的项目，在社区中比较火爆，甚至在容器领域形成事实的监控缺省方案。在国内外被普遍采用。
TimescaleDB：基于优秀的PostgreSQL构建出的时序数据库。长远考虑，专业的TSDB必须是从底层存储面向时序数据的特征进行针对性设计和优化的。因此它不在本文中进一步分析。
Apache Druid：非常有名的实时OLAP分析平台，面向时序数据设计的，在极致性能和数据schema的灵活性方面有一定的平衡。类似的产品还有Pinot、Kylin等。
OpenTSDB：基于HBase构建的时序数据库，依赖Hadoop生态太重，早期和InfluxDB并驾齐驱；近年来在社区中的热度已经远远落后于InfluxDB了。它还不支持多维查询。因此，它也排除在外。
ClickHouse：俄罗斯Yandex开发的数据分析数据库（OLAP），但它可以充当TSDB来使用。本文不做深入分析。
IoTDB：国内清华大学开源的时序数据库，面向工业IoT场景；性能出众，社区活跃。

本文参考:https://zhuanlan.zhihu.com/p/410255386

正文到此结束

所属分类：数据库

本文标签： 数据库
本文链接： https://www.php20.cn/article/367
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。

时序数据库学习一:什么是时序数据库

时序数据库

时序数据的特征

时序数据库的基本概念

Time series

Metric（度量指标）

时序数据库的项目

热门推荐

相关文章

说给你听

本文目录

标签云

近期评论

网站信息