Моделирование данных, соединения, связи и схемы в Power BI
Новички часто сосредотачиваются на чистоте данных и красивых графиках. Они думают, что визуализация — это самая важная часть анализа.
Они ошибаются.
Ваш анализ зависит от того, как вы организуете свои данные. Неправильная модель данных приводит к неверным числам.
Power BI показывает вам графики и карточки KPI. Настоящая работа происходит в модели. Это означает то, как вы управляете таблицами, как они взаимодействуют друг с другом и как через них проходят фильтры.
Понимание этих четырех столпов имеет решающее значение:
- Моделирование данных Это чертеж ваших данных. Вы структурируете данные в таблицы и определяете связи. Хорошая модель обеспечивает:
- Легкое создание отчетов
- Точные расчеты
- Высокую производительность
- Схемы Схема — это структура ваших таблиц.
- Схема «Звезда» (Star Schema): одна таблица фактов в центре и несколько таблиц измерений вокруг нее. Это лучший вариант для простого DAX и высокой скорости работы.
- Схема «Снежинка» (Snowflake Schema): расширение схемы «звезда», где таблицы измерений разбиваются на еще более мелкие таблицы.
- Соединения (Joins) Соединения объединяют две таблицы с помощью общего столбца.
- Inner Join (Внутреннее соединение): возвращает только совпадающие строки из обеих таблиц.
- Left Outer Join (Левое внешнее соединение): возвращает все строки из левой таблицы и соответствующие строки из правой.
- Right Outer Join (Правое внешнее соединение): возвращает все строки из правой таблицы и соответствующие строки из левой.
- Full Outer Join (Полное внешнее соединение): возвращает все строки из обеих таблиц.
- Left Anti Join (Левое анти-соединение): возвращает строки из левой таблицы, для которых нет совпадений в правой.
- Right Anti Join (Правое анти-соединение): возвращает строки из правой таблицы, для которых нет совпадений в левой.
- Связи (Relationships) Связи говорят Power BI, как таблицы взаимодействуют друг с другом.
- Один ко многим (One-to-many): одно уникальное значение в одной таблице связано со многими значениями в другой.
- Многие ко многим (Many-to-many): на обеих сторонах существует несколько совпадающих строк.
- Один к одному (One-to-one): одно значение в одной таблице связано с одним значением в другой.
Не относитесь к моделированию как к задаче, которую нужно выполнить перед началом настоящей работы. Моделирование и есть настоящая работа.
Схема «звезда» обеспечивает быстроту ваших запросов. Соединения помогают извлекать нужные данные. Связи делают ваши отчеты интерактивными. Если вы ошибетесь с направлением фильтрации или кардинальностью (cardinality), ваши фильтры не будут работать.
Сначала постройте прочный фундамент.
Источник: https://dev.to/datawithian/data-modelling-joins-relationships-and-schemas-in-power-bi-48pm
Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi
