Mô hình hóa dữ liệu, Phép nối (Joins), Mối quan hệ và Sơ đồ trong Power BI
Những người mới bắt đầu thường tập trung vào việc làm sạch dữ liệu và tạo ra các biểu đồ đẹp mắt. Họ nghĩ rằng hình ảnh trực quan là phần quan trọng nhất của quá trình phân tích.
Họ đã lầm.
Phân tích của bạn phụ thuộc vào cách bạn tổ chức dữ liệu. Một mô hình dữ liệu bị lỗi sẽ dẫn đến những con số sai lệch.
Power BI hiển thị cho bạn các biểu đồ và thẻ KPI. Công việc thực sự nằm ở mô hình. Điều này có nghĩa là cách bạn quản lý các bảng, cách chúng tương tác với nhau và cách các bộ lọc (filters) truyền qua chúng.
Hiểu rõ bốn trụ cột này là điều thiết yếu:
- Mô hình hóa dữ liệu (Data Modelling) Đây là bản thiết kế cho dữ liệu của bạn. Bạn cấu trúc dữ liệu thành các bảng và xác định các kết nối. Một mô hình tốt sẽ đảm bảo:
- Xây dựng báo cáo dễ dàng
- Tính toán chính xác
- Hiệu suất nhanh hơn
- Sơ đồ (Schemas) Sơ đồ là cấu trúc của các bảng của bạn.
- Star Schema: Một bảng sự kiện (fact table) ở trung tâm với nhiều bảng chiều (dimension tables) xung quanh. Đây là lựa chọn tốt nhất để viết DAX đơn giản và đạt tốc độ cao.
- Snowflake Schema: Một bản mở rộng của star schema, nơi các bảng chiều được chia nhỏ thành nhiều bảng hơn nữa.
- Phép nối (Joins) Các phép nối kết hợp hai bảng bằng cách sử dụng một cột chung.
- Inner Join: Chỉ trả về các hàng khớp nhau từ cả hai bảng.
- Left Outer Join: Trả về tất cả các hàng từ bảng bên trái và các hàng khớp nhau từ bảng bên phải.
- Right Outer Join: Trả về tất cả các hàng từ bảng bên phải và các hàng khớp nhau từ bảng bên trái.
- Full Outer Join: Trả về tất cả các hàng từ cả hai bảng.
- Left Anti Join: Trả về các hàng từ bảng bên trái mà không có kết quả khớp ở bảng bên phải.
- Right Anti Join: Trả về các hàng từ bảng bên phải mà không có kết quả khớp ở bảng bên trái.
- Mối quan hệ (Relationships) Các mối quan hệ cho Power BI biết cách các bảng hoạt động cùng nhau.
- One-to-many: Một giá trị duy nhất trong một bảng kết nối với nhiều giá trị trong một bảng khác.
- Many-to-many: Có nhiều hàng khớp nhau tồn tại ở cả hai phía.
- One-to-one: Một giá trị trong một bảng kết nối với một giá trị trong bảng khác.
Đừng coi việc mô hình hóa chỉ là một nhiệm vụ cần hoàn thành trước khi bắt đầu công việc thực sự. Mô hình chính là công việc thực sự.
Star schema giúp các truy vấn của bạn nhanh hơn. Phép nối giúp bạn lấy đúng dữ liệu. Các mối quan hệ làm cho báo cáo của bạn có tính tương tác. Nếu bạn xác định sai hướng (direction) hoặc tính bản số (cardinality), các bộ lọc của bạn sẽ không hoạt động chính xác.
Hãy xây dựng một nền tảng vững chắc trước tiên.
Source: https://dev.to/datawithian/data-modelling-joins-relationships-and-schemas-in-power-bi-48pm
Optional learning community: https://t.me/GyaanSetuAi
