𝗔𝗜는 PSU를 교체하라고 했고, 그는 한 번 더 테스트하자고 했다

마르코에게 문제가 생겼다. AI 모델을 실행할 때마다 PC가 재부팅되었다.

오류도, 로그도 없었다. 화면이 그냥 검게 변했다.

그는 디버깅을 위해 AI 에이전트를 사용했다.

AI가 원격 로그를 설정했지만, 로그에는 아무런 기록도 남지 않았다.

이는 CPU가 기록을 남길 새도 없이 PC가 꺼졌음을 의미했다. 하드웨어 리셋이었다.

AI가 이력을 확인했다. 마르코는 예전에 불량 파워 서플라이를 사용한 적이 있었다. AI는 그에게 새 제품을 구매하라고 권했다.

마르코는 잠시 멈췄다. 그는 한 가지 세부 사항을 발견했다.

284와트의 고부하 테스트는 안정적이었다. 그런데 아주 작은 요청이 들어오자 PC가 꺼졌다.

불량 파워 서플라이는 보통 고부하 상태에서 고장이 난다. 하지만 이번에는 이상한 부하 조건에서 문제가 발생했다.

그는 AI에게 부하의 형태(load shape)를 테스트해 달라고 요청했다.

그들은 트리거를 찾아냈다. 부분적인 오프로딩(partial offloading)이 끊김(stutter)을 유발했고, 이 끊김이 시스템을 다운시켰다. 전체 오프로딩은 문제없이 작동했다.

마르코는 하드웨어에 돈을 쓰지 않았다. 대신 설정 하나를 변경했다.

시스템은 2,272번의 요청 동안 안정적으로 유지되었다.

당신을 위한 교훈:

  • 침묵도 데이터다. 로그가 비어 있다면 소프트웨어 너머를 살펴보라.
  • 트리거를 찾아라. 유령을 쫓는 일을 멈추고 실험을 수행하라.
  • 부하의 크기가 아니라 형태를 테스트하라.
  • 데이터가 이상하다고 느껴질 때는 직관을 믿어라.

AI는 훌륭한 도구다. 빠르고 지치지 않는다. 하지만 논리의 빈틈을 찾아내는 것은 인간이다.

이 둘이 함께 버그를 해결했다.

출처: https://dev.to/lenriqueotero/his-ai-said-swap-the-psu-he-said-one-more-test-2i7g 선택 사항 학습 커뮤니티: https://t.me/GyaanSetuAi