Моделювання даних, об'єднання (Joins), зв'язки та схеми в Power BI

Початківці часто зосереджуються на чистих даних та гарних діаграмах. Вони вважають, що візуалізація — це найважливіша частина аналізу.

Вони помиляються.

Ваш аналіз залежить від того, як ви організовуєте свої дані. Погана модель даних призводить до неправильних значень.

Power BI показує вам графіки та картки KPI. Справжня робота відбувається в моделі. Це означає те, як ви керуєте таблицями, як вони взаємодіють і як через них проходять фільтри.

Розуміння цих чотирьох основ є критично важливим:

  1. Моделювання даних (Data Modelling) Це проєкт (blueprint) ваших даних. Ви структуруєте дані в таблиці та визначаєте зв'язки. Хороша модель забезпечує:
  • Легке створення звітів
  • Точні розрахунки
  • Вищу швидкість роботи
  1. Схеми (Schemas) Схема — це структура ваших таблиць.
  • Схема «зірка» (Star Schema): одна таблиця фактів у центрі та кілька таблиць вимірів навколо неї. Це найкращий варіант для простого DAX та швидкості.
  • Схема «сніжинка» (Snowflake Schema): розширення схеми «зірка», де таблиці вимірів розбиваються на ще більше таблиць.
  1. Об'єднання (Joins) Об'єднання поєднують дві таблиці за допомогою спільного стовпця.
  • Inner Join (Внутрішнє об'єднання): повертає лише відповідні рядки з обох таблиць.
  • Left Outer Join (Ліве зовнішнє об'єднання): повертає всі рядки з лівої таблиці та відповідні рядки з правої.
  • Right Outer Join (Праве зовнішнє об'єднання): повертає всі рядки з правої таблиці та відповідні рядки з лівої.
  • Full Outer Join (Повне зовнішнє об'єднання): повертає всі рядки з обох таблиць.
  • Left Anti Join (Ліве анти-об'єднання): повертає рядки з лівої таблиці, для яких немає відповідності в правій.
  • Right Anti Join (Праве анти-об'єднання): повертає рядки з правої таблиці, для яких немає відповідності в лівій.
  1. Зв'язки (Relationships) Зв'язки вказують Power BI, як таблиці взаємодіють між собою.
  • Один-до-багатьох (One-to-many): одне унікальне значення в одній таблиці пов'язане з багатьма значеннями в іншій.
  • Багато-до-багатьох (Many-to-many): на обох сторонах існують декілька відповідних рядків.
  • Один-до-одного (One-to-one): одне значення в одній таблиці пов'язане з одним значенням в іншій.

Не ставтеся до моделювання як до завдання, яке потрібно виконати перед справжньою роботою. Модель — це і є справжня робота.

Схема «зірка» забезпечує швидкість ваших запитів. Об'єднання допомагають витягувати правильні дані. Зв'язки роблять ваші звіти інтерактивними. Якщо ви помилитеся з напрямком або кардинальністю, ваші фільтри працюватимуть некоректно.

Спочатку побудуйте міцний фундамент.

Джерело: https://dev.to/datawithian/data-modelling-joins-relationships-and-schemas-in-power-bi-48pm

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi