Power BI의 데이터 모델링, 조인, 관계 및 스키마

초보자들은 종종 깔끔한 데이터와 예쁜 차트에 집중합니다. 그들은 시각화가 분석에서 가장 중요한 부분이라고 생각합니다.

하지만 그것은 틀렸습니다.

분석은 데이터를 어떻게 구성하느냐에 달려 있습니다. 잘못된 데이터 모델은 잘못된 수치로 이어집니다.

Power BI는 차트와 KPI 카드를 보여줍니다. 하지만 진짜 작업은 모델에서 이루어집니다. 즉, 테이블을 어떻게 관리하는지, 테이블 간에 어떻게 상호작용하는지, 그리고 필터가 어떻게 전달되는지가 핵심입니다.

다음 네 가지 핵심 요소를 이해하는 것이 필수적입니다:

  1. 데이터 모델링 (Data Modelling) 이것은 데이터의 청사진입니다. 데이터를 테이블로 구조화하고 연결을 정의합니다. 좋은 모델은 다음을 보장합니다:
  • 쉬운 보고서 작성
  • 정확한 계산
  • 빠른 성능
  1. 스키마 (Schemas) 스키마는 테이블의 구조입니다.
  • Star Schema (스타 스키마): 중앙에 하나의 팩트(fact) 테이블이 있고 주변에 여러 차원(dimension) 테이블이 있는 형태입니다. 단순한 DAX 작성과 속도 면에서 가장 좋습니다.
  • Snowflake Schema (스노우플레이크 스키마): 스타 스키마의 확장형으로, 차원 테이블이 더 세부적인 테이블로 나뉘는 형태입니다.
  1. 조인 (Joins) 조인은 공통 열을 사용하여 두 테이블을 결합합니다.
  • Inner Join (내부 조인): 양쪽 테이블에서 일치하는 행만 반환합니다.
  • Left Outer Join (왼쪽 외부 조인): 왼쪽 테이블의 모든 행과 오른쪽 테이블의 일치하는 행을 반환합니다.
  • Right Outer Join (오른쪽 외부 조인): 오른쪽 테이블의 모든 행과 왼쪽 테이블의 일치하는 행을 반환합니다.
  • Full Outer Join (전체 외부 조인): 양쪽 테이블의 모든 행을 반환합니다.
  • Left Anti Join (왼쪽 안티 조인): 오른쪽 테이블에 일치하는 항목이 없는 왼쪽 테이블의 행을 반환합니다.
  • Right Anti Join (오른쪽 안티 조인): 왼쪽 테이블에 일치하는 항목이 없는 오른쪽 테이블의 행을 반환합니다.
  1. 관계 (Relationships) 관계는 Power BI에 테이블이 어떻게 함께 작동하는지 알려줍니다.
  • One-to-many (일대다): 한 테이블의 고유한 값이 다른 테이블의 여러 값과 연결됩니다.
  • Many-to-many (다대다): 양쪽 모두에 여러 개의 일치하는 행이 존재합니다.
  • One-to-one (일대일): 한 테이블의 값이 다른 테이블의 하나의 값과 연결됩니다.

모델링을 진짜 작업을 시작하기 전에 끝내야 할 숙제처럼 취급하지 마세요. 모델링 자체가 진짜 작업입니다.

스타 스키마는 쿼리 속도를 빠르게 유지해 줍니다. 조인은 올바른 데이터를 가져오는 데 도움을 줍니다. 관계는 보고서를 상호작용 가능하게 만듭니다. 만약 방향(direction)이나 카디널리티(cardinality)를 잘못 설정하면 필터가 제대로 작동하지 않을 것입니다.

먼저 탄탄한 기초를 쌓으세요.

Source: https://dev.to/datawithian/data-modelling-joins-relationships-and-schemas-in-power-bi-48pm

Optional learning community: https://t.me/GyaanSetuAi