关于海天味业的财报研究分析 Posted on 2017-12-10 | In Muse | | Heat: ℃ Words count in article: 5,397 words | Reading time ≈ 19 min 本文详细总结了海天味业(603288)年报数据脉搏和公司价值分析,为以后分析打下基础。 海天味业财务报表全景图成长指标 2011-2016年,净利润从9.56亿到28.43亿,增长了2.97倍,复合增长率为19.9%,优秀的可持续性增长。 2011-2016年,营业收入从60.91到124.59亿, ... Read more »
浅谈数据仓库建设 Posted on 2017-12-06 | In Coding | | Heat: ℃ Words count in article: 7,455 words | Reading time ≈ 25 min 本文想谈谈数据仓库建模的过程。虽然每个行业有自己的模型,但是,我们发现,不同行业的数据模型,在数据建模的方法上,却都有着共通的基本特点。 本文的主要目的之一,就是希望读者能够通过对本文的阅读,同时,结合自己对数据仓库建设的经验,在建设数据仓库的时候能够总结出一套适合自己的建模方法,能够更好的帮助客户 ... Read more »
Hive性能优化Tips Posted on 2017-11-29 | In Coding | | Heat: ℃ Words count in article: 5,409 words | Reading time ≈ 21 min 介绍首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题。 jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原因是map reduce作业初始化的时间是比较长的。 sum,co ... Read more »
Hive优化过程思路 Posted on 2017-11-27 | In Coding | | Heat: ℃ Words count in article: 3,290 words | Reading time ≈ 12 min Hive支持多种压缩格式,有的压缩格式支持split,而有的并不支持,比如LZO。当不支持split的时候,数据块有多大,Hive的map任务就得处理多大,而Hive表的分区数据有可能存在不均衡的现象,就会导致有的map快,有的map慢。当遇到LZO格式的时候,最好的方式是建立索引,可以加快处理速度 ... Read more »
关系型数据库范式深度解析 Posted on 2017-11-27 | | Heat: ℃ Words count in article: 4,397 words | Reading time ≈ 15 min 概念首先要明白范式(NF)是什么意思。按照教材中的定义,范式是: 符合某一种级别的关系模式的集合,表示一个关系内部各属性之间的联系的合理化程度。 很晦涩吧?实际上你可以把它粗略地理解为一张数据表的表结构所符合的某种设计标准的级别。就像家里装修买建材,最环保的是E0级,其次是E1级,还有E2级等等。数 ... Read more »