Power BI 中的数据建模、联接、关系与模式
初学者往往专注于清洗数据和制作漂亮的图表。他们认为可视化是分析中最重要的部分。
他们错了。
你的分析取决于你如何组织数据。一个损坏的数据模型会导致错误的数据结果。
Power BI 向你展示图表和 KPI 卡片。真正的核心工作发生在模型中。这意味着你如何管理表、它们如何交互,以及过滤器如何在它们之间传递。
理解这四大支柱至关重要:
- 数据建模 (Data Modelling) 这是你数据的蓝图。你将数据结构化为表并定义连接。一个好的模型可以确保:
- 轻松构建报表
- 准确的计算
- 更快的性能
- 模式 (Schemas) 模式是表的结构。
- 星型模式 (Star Schema):中心是一个事实表,周围环绕着若干维度表。这最有利于编写简单的 DAX 并提升速度。
- 雪花模式 (Snowflake Schema):星型模式的扩展,其中维度表进一步拆分为更多的表。
- 联接 (Joins) 联接通过公共列将两个表结合起来。
- 内联接 (Inner Join):仅返回两个表中匹配的行。
- 左外联接 (Left Outer Join):返回左表的所有行以及右表的匹配行。
- 右外联接 (Right Outer Join):返回右表的所有行以及左表的匹配行。
- 全外联接 (Full Outer Join):返回两个表中的所有行。
- 左反联接 (Left Anti Join):返回左表中在右表中没有匹配项的行。
- 右反联接 (Right Anti Join):返回右表中在左表中没有匹配项的行。
- 关系 (Relationships) 关系告诉 Power BI 表之间如何协同工作。
- 一对多 (One-to-many):一个表中的唯一值连接到另一个表中的多个值。
- 多对多 (Many-to-many):两侧都存在多个匹配行。
- 一对一 (One-to-one):一个表中的一个值连接到另一个表中的一个值。
不要把建模仅仅视为在开展“真正工作”之前需要完成的一项任务。模型本身就是真正的核心工作。
星型模式能保持查询的高效。联接帮助你提取正确的数据。关系让你的报表具有交互性。如果你搞错了方向 (direction) 或基数 (cardinality),你的过滤器将会失效。
先打好坚实的基础。
来源:https://dev.to/datawithian/data-modelling-joins-relationships-and-schemas-in-power-bi-48pm
可选学习社区:https://t.me/GyaanSetuAi
