Rona

DataLineage로 파이프라인 의존성 자동 추적 만들기

중급357시간 전

스키마나 칼럼명을 바꾸기 전에 DataLineage API 형태로 자산 의존성을 조회하고, downstream 영향 범위와 배포 차단 여부를 자동으로 판단합니다. 실제 API 키가 없어도 샘플 파이프라인 그래프로 실행되는 Python 자동화 코드와 pre-migration safety check 유틸리티, 영향 분석 JSON/Markdown 결과물을 만듭니다.

이 실습은 터미널에서 진행됩니다

이런 걸 배워요

  • DataLineage API 형태로 자산 의존성을 조회할 수 있습니다
  • 다운스트림 영향 범위를 자동으로 계산할 수 있습니다
  • 칼럼 변경이 배포를 막아야 하는지 정책으로 판단할 수 있습니다
  • PM 승인 코멘트에 사용할 영향 분석 요약을 만들 수 있습니다

어떻게 진행해요

1. 환경 확인
2. 필요 패키지 설치
3. 예시 파이프라인 그래프 준비
4. DataLineage 조회 코드 작성
5. 배포 차단 규칙 추가
6. 안전 점검 실행
7. 승인 코멘트 작성

AI 튜터가 각 단계를 하나씩 안내해줄 거예요

DataLineage로 파이프라인 의존성 자동 추적 만들기 (중급)