中泰帮助文档
数据资产
测试知识库
111
本文档由AAA团队创作
-
+
首页
测试知识库
<h4>1. 维度建模</h4><p>维度建模是数据仓库领域的灵魂人物 Ralph Kimball 推崇的方法。它的设计出发点非常明确:<strong><strong>如何让数据分析更快、更简单。</strong></strong></p><p><strong><strong>核心组件:</strong></strong></p><p><strong><strong>事实表</strong></strong></p><p><strong><strong>是什么</strong></strong>:存储业务过程的<strong><strong>度量值</strong></strong>(通常是可加的数字,如销售额、数量、点击次数)。</p><p><strong><strong>特点</strong></strong>:主要由外键(指向维度表)和度量值(事实)组成。通常又细分为<strong><strong>事务事实表</strong></strong>(记录每个事件)、<strong><strong>周期快照事实表</strong></strong>(按周期汇总)和<strong><strong>累积快照事实表</strong></strong>(跟踪工作流过程)。</p><p><strong><strong>例子</strong></strong>:销售事实表 包含 销售金额、销售数量,以及 产品键、日期键、商店键 等外键。</p><p><strong><strong>维度表</strong></strong></p><p><strong><strong>是什么</strong></strong>:存储描述业务过程的<strong><strong>上下文和环境信息</strong></strong>,是分析时用于“筛选、分组、标记”的文本性字段。</p><p><strong><strong>特点</strong></strong>:包含大量的描述性属性,通常是宽表(有很多列)。</p><p><strong><strong>例子</strong></strong>:产品维度表 包含 产品名称、产品类别、品牌、颜色、尺寸 等;日期维度表 包含 年月日、星期几、是否节假日、财年季度 等。</p><p><strong><strong>常见模型:</strong></strong></p><p><strong><strong>星型模式</strong></strong>:最简单、最常用的维度模型。事实表在中心,多个维度表围绕在四周,并通过外键直接与事实表相连。</p><p><strong><strong>雪花模式</strong></strong>:是星型模式的规范化版本。维度表本身可能又被其他更细粒度的维度表所关联,形成一种类似雪花的层次结构。这会减少数据冗余,但会增加查询的连接次数,可能影响性能。</p><p><strong><strong>优点:</strong></strong></p><p><strong><strong>性能极佳</strong></strong>:查询时只需要连接少数几张表,非常适合大数据量的聚合查询。</p><p><strong><strong>易于理解和使用</strong></strong>:业务人员可以直观地理解星型模型,因为他们思考业务的方式就是“我想按某个维度(如时间、地区)查看某个指标(如销售额)”。</p><p><strong><strong>可扩展性好</strong></strong>:新增维度或向维度表中添加新属性相对容易。</p><p><strong><strong>缺点:</strong></strong></p><p><strong><strong>数据冗余</strong></strong>:维度表中的大量描述性字段会造成数据重复存储。</p><p><strong><strong>数据更新复杂</strong></strong>:如果维度属性发生变化(如客户地址变更),需要采用<strong><strong>缓慢变化维</strong></strong>技术来处理,逻辑较为复杂。</p><p><strong><strong>不适合OLTP</strong></strong>:无法保证复杂的事务处理和数据写入的高效性。</p>
yoyo1q2w
2026年1月21日 10:44
转发
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期
AI