发布时间:2019-03-07
分类:数据蒋堂
Tag:多维分析,数据蒋堂,蒋步星
我们在《多维分析预汇总的存储容量》中计算过,如果想做到O(1)的复杂度,至少要考虑界面用到的各种维度组合,这在维度总量稍多一点时就不可行了。 这样,我们就只能放弃O(1)复杂度的期望了,不把每种可能出…
发布时间:2019-02-28
分类:数据蒋堂
Tag:多维分析,数据蒋堂,蒋步星,预汇总
在进一步讨论如何在有限空间内实现多维分析的预汇总之前,我们有必要再了解一下预汇总方案还有什么功能上的不足,也就是要搞清还有什么查询需求很可能无法通过预汇总数据获取。 1.非常规聚合 预汇总方案是将测度…
在进一步讨论如何在有限空间内实现多维分析的预汇总之前,我们有必要再了解一下预汇总方案还有什么功能上的不足,也就是要搞清还有什么查询需求很可能无法通过预汇总数据获取。 1. 非常规聚合 预汇总方案是将测…
发布时间:2019-02-26
分类:数据蒋堂
Tag:多维分析,存储,数据蒋堂,蒋步星
多维分析一般是交互式操作的,也就要求有极高的响应速度,而多维分析涉及的数据量常常很大,几千万上亿行甚至更大都有,临时统计很可能跟不上界面的操作。为了保证性能,一些多维分析产品采用了预汇总方案,也就是把…
发布时间:2019-02-20
分类:数据蒋堂
Tag:数据库,数据蒋堂,蒋步星
我们知道,数据库的数据处理能力是封闭的。所谓封闭性,这里是指要被数据库计算和处理的数据,必须事先装入数据库之内,数据在数据库内部还是外部是很明确的。 数据库一般有OLTP和OLAP两个用途。对于OLT…
发布时间:2019-02-20
分类:数据蒋堂
Tag:性能优化,数据蒋堂,蒋步星
做一次标题党,其实我们做软件的当然没办法改变芯片的性能,也不可能真地让国产芯片超越Intel。 这个话题从去年做过的一次性能测试说起,先看测试结果: 【注】SPL是润乾集算器采用的程序设计语言;SQL…
发布时间:2018-12-11
分类:数据蒋堂
Tag:中国报表,数据蒋堂,蒋步星
按:在敏捷BI横行的年代,报表这个概念也有了更大的外延,很多用户甚至技术人员都会将由复杂格式报表与BI系统中拖拽出来的报表混为一谈。这是一篇2004年底写的老文,现在重读,对于理解复杂报表仍有意义,不…
发布时间:2018-12-04
分类:数据蒋堂
Tag:数据蒋堂,蒋步星
当我们要对数据做一些非常规的复杂运算时,通常要将数据装入内存。现在也有不少程序设计语言提供了内存数据集对象及基本的运算方法,可以较方便地实现这类运算。不过,如果对内存数据集的工作原理了解不够,就可能写…
发布时间:2018-11-27
分类:数据蒋堂
Tag:报表工具,报表开发,数据蒋堂,蒋步星,计算工具
报表的业务稳定性天生很差,业务开展过程中会催生出许多新的查询统计需求,这就造成了没完没了的报表,这是个无法被消灭的任务,也是许多行业软件开发商非常头疼的事情。投入了很多人力,也引入了专业报表工具以及敏…
发布时间:2018-11-20
分类:数据蒋堂
Tag:排序分组,数据蒋堂,蒋步星
上一期我们说了前半有序的数据,这次我们来看看“后半”有序的情况。 回顾一下前半有序的说法:我们要把数据集T按字段a,b排序时,如果T已经对a有序,则可以利用这一特点实现高性能算法。但后半有序却不是对称…