【数据蒋堂】第44期:谈谈临时性计算

【数据蒋堂】第44期:谈谈临时性计算

发布时间:2018-02-27 分类:数据蒋堂 Tag:,,,,,

临时性计算,顾名思义,是指临时发生的一些计算需求。这种计算在日常数据处理中很常见,我们举一些例子:

应对 [查看全文]

【数据蒋堂】第43期:报表开发的现状

【数据蒋堂】第43期:报表开发的现状

发布时间:2018-02-22 分类:数据蒋堂 Tag:,,,,

报表开发,看起来只是数据呈现环节的事务,并不起眼,但仔细想想,它涉及的工作范围却非常广。如果把查询和交互分析也认为 [查看全文]

【数据蒋堂】第42期:RDB与NoSQL的访问性能

【数据蒋堂】第42期:RDB与NoSQL的访问性能

发布时间:2018-02-12 分类:数据蒋堂 Tag:,,,,

我们继续从软件角度上看外存数据源的性能,来考察数据库的性能特点,在这篇文章中,我们只关心数据的访问性能,而不涉及计 [查看全文]

【数据蒋堂】第41期:文件的性能分析

【数据蒋堂】第41期:文件的性能分析

发布时间:2018-02-06 分类:数据蒋堂 Tag:,,,,

我们以前讲过硬盘的性能特征,主要是针对硬件层面进行分析的,现在我们来考虑软件层面的差异。

理论上讲,软件可以穿 [查看全文]

【数据蒋堂】第40期:倍增分段技术

【数据蒋堂】第40期:倍增分段技术

发布时间:2018-01-23 分类:数据蒋堂 Tag:,

区块分段方案能够满足我们设定的4个目标。不过,除了处理区块标记的麻烦外,这个办法对于列存也不是非常适合。

数据 [查看全文]

【数据蒋堂】第39期:数据分段讨论

【数据蒋堂】第39期:数据分段讨论

发布时间:2018-01-16 分类:数据蒋堂 Tag:,,

现代计算机一般都有多CPU核,而日益广泛应用的固态硬盘也有较强的并发能力,这些硬件资源都为并行计算提供了有力的保证 [查看全文]

【数据蒋堂】第38期:JOIN延伸 - 维度其它应用

【数据蒋堂】第38期:JOIN延伸 – 维度其它应用

发布时间:2018-01-09 分类:数据蒋堂 Tag:,,,

明确维度定义后,还可以换一种更清晰的方式来审视数据库的结构。

这是我们常见的E-R图:

E-R图是个 [查看全文]

【数据蒋堂】第37期:JOIN延伸 - 维度查询语法

【数据蒋堂】第37期:JOIN延伸 – 维度查询语法

发布时间:2018-01-03 分类:数据蒋堂 Tag:,,

有了维度定义后,我们就可以来梳理前面讲过的简化JOIN语法了。

先定义字段维度:

维度字段的维度为其 [查看全文]

【数据蒋堂】第36期:JOIN延伸:维度概念

【数据蒋堂】第36期:JOIN延伸:维度概念

发布时间:2017-12-25 分类:数据蒋堂 Tag:,,

谈到数据分析时常常会用到维度这个词,针对数据立方体的钻取、旋转、切片等操作都是围绕维度进行的,几乎所有的数据分析人 [查看全文]

【数据蒋堂】第35期:JOIN提速 - 有序归并

【数据蒋堂】第35期:JOIN提速 – 有序归并

发布时间:2017-12-18 分类:数据蒋堂 Tag:,,,,

我们再来看同维表和主子表的JOIN,这两种情况的优化提速手段是一样的。

设两个关联表的规模(记录数)分别是N和 [查看全文]