AI 说换电源,他说再测一次

Marco 遇到了一个问题。每当他的 AI 模型运行时,电脑就会重启。

没有错误。没有日志。屏幕直接黑掉。

他使用了一个 AI Agent 来进行调试。

AI 设置了远程日志。但日志始终一片空白。

这证明了电脑死机速度太快,CPU 甚至来不及写入日志。这是一次硬件重启。

AI 检查了历史记录。Marco 以前用过一个坏掉的电源。AI 建议他买个新的。

Marco 停了下来。他注意到一个细节。

284 瓦的高负载测试运行稳定。而一个极小的请求却让电脑挂了。

坏掉的电源通常在重负载下失效。而这次是在一种奇怪的负载下失效的。

他要求 AI 测试负载形态(load shape)。

他们找到了触发点。部分卸载(Partial offloading)导致了卡顿。这种卡顿导致了机器关机。而完全卸载(Full offloading)则运行正常。

Marco 没有花钱买硬件。他只改了一个设置。

系统在 2,272 次请求后依然保持稳定。

给你的启示:

  • 沉默即数据。如果日志为空,请从软件层级以下寻找原因。
  • 找到触发点。停止像捉鬼一样盲目寻找。进行实验。
  • 测试负载的形态,而非负载的大小。
  • 当数据感觉不对劲时,相信你的直觉。

AI 是一个强大的工具。它快速且不知疲倦。但人类能发现逻辑中的漏洞。

这对搭档解决了这个 Bug。

Source: https://dev.to/lenriqueotero/his-ai-said-swap-the-psu-he-said-one-more-test-2i7g Optional learning community: https://t.me/GyaanSetuAi