数据仓库环境
1、结构(不同的细节级)
2、面向主题
3、颗粒度(双重颗粒度)
4、分区(时间)
5、数据清理
数据仓库的开发是反复的,先开发一部分然后再根据实际组建另一部分。
1、结构(不同的细节级)
2、面向主题
3、颗粒度(双重颗粒度)
4、分区(时间)
5、数据清理
数据仓库的开发是反复的,先开发一部分然后再根据实际组建另一部分。
刚刚看完数据仓库的第一章,感觉数据分析是件很扯淡很忽悠人的东西。
首先,数据源的准确性?
1、外部数据。比如艾瑞的数据都是从别人那拿来的再加工的。
2、整合加工数据再处理。对于管理层来说,他们得到的数据报表也是一级级下属加工后已经和原始数据大相径庭了。
其次,基础的KPI。就算全部都是原始的log,且确保程序猿对业务逻辑清晰,统计出来的报表正确。也只能保证基础的KPI报表基本准确而已。
第三