이번 주에 배운 5가지
저는 AI 디렉토리 사이트와 YouTube 자동화 파이프라인을 운영하고 있습니다. 이번 주에 몇 가지 마찰 지점을 겪었습니다. 조정을 거치며 얻은 다섯 가지 교훈을 공유합니다.
- CI 비용을 관리하세요
Bluesky 포스팅 스크립트가 GitHub Actions 사용 시간을 낭비하고 있었습니다. 포스트를 올릴 때마다 세 개의 사이트 전체에서 대규모 빌드 프로세스가 실행되었습니다. 단순한 상태 업데이트를 위해 매주 120분을 쓰고 있었던 셈입니다.
두 가지 변경 사항을 적용했습니다:
- 하루 3번 실행되던 트리거를 하루 1번으로 변경했습니다.
- 텍스트 수정 시 사이트 전체가 다시 빌드되지 않도록 경로 필터(path filter)를 추가했습니다.
사소한 작업 때문에 자동화 할당량을 낭비하지 마세요. 프로젝트가 커지기 전에 이러한 습관을 바로잡아야 합니다.
- 자동화에 품질 관리(QC)를 추가하세요
대기열에서 봇이 쓴 것 같은 포스트 17개를 발견했습니다. 'auto-generated(자동 생성됨)'와 같은 문구가 포함되어 있었는데, 이는 제 퍼스널 브랜딩에 맞지 않았습니다.
파이프라인에 QC 게이트를 추가했습니다. 이 단계에서는 다음 사항을 확인합니다:
- 깨진 링크.
- 만료된 뉴스.
- 로봇 같거나 스팸 같은 말투.
포스트가 통과하지 못하면 수동 검토를 위해 대기열에 남습니다. 이제 포스팅 빈도는 줄었지만 품질은 더 높아졌습니다.
- 단순함이 최적화보다 나을 수 있습니다
AI 모델 라우팅을 제거해 보았습니다. 이전에는 간단한 작업은 저렴한 모델로, 어려운 작업은 비싼 모델로 보내곤 했습니다.
라우터를 제거한 후 다음과 같은 결과를 얻었습니다:
- 지연 시간(Latency)은 동일했습니다.
- 비용은 8% 상승했습니다.
- 코드는 훨씬 단순해졌습니다.
라우팅 오류를 디버깅하는 수고를 덜기 위해서라면 8%의 비용 상승은 감수할 만한 가치가 있습니다. 소규모 규모에서는 복잡성을 관리하는 비용이 API 절감 비용보다 더 큽니다.
- 라이선스를 주의 깊게 확인하세요
Openverse를 사용하여 YouTube 도구에 이미지 슬라이드를 추가했습니다. 기본 검색 결과에는 다양한 유형의 Creative Commons 라이선스가 포함되어 있습니다.
CC0 또는 PDM 라이선스로 필터링하지 않으면 화면에 출처를 표기해야 하는 이미지를 사용할 수도 있습니다. 수익 창출 채널의 경우 이는 법적 리스크가 됩니다. 실수로 저작권 문제를 일으키지 않도록 항상 API 요청 단계(upstream)에서 필터링하세요.
- 모니터링 도구는 사용 편의성에 달려 있습니다
Netdata, SigNoz, OpenObserve를 테스트했습니다.
- Netdata는 사용하기 쉽고 즉시 작동합니다.
- SigNoz는 OpenTelemetry를 사용하여 코드에 계측(instrumentation)을 해야 합니다.
- OpenObserve는 로그 관리에 훌륭하지만 학습 곡선이 가파릅니다.
현재 제 설정에는 이러한 도구들이 과하게 느껴졌습니다. 대신 간단한 에러 알림 통합 방식을 선택했습니다. 가장 복잡한 도구가 아니라, 현재 인프라에 적합한 도구를 선택하세요.
출처: https://dev.to/morinaga/5-things-i-noticed-this-week-ci-cost-bluesky-qc-and-cc0-licensing-49ig
