AIは「PSUを交換しろ」と言い、彼は「もう一度テストを」と言った

マルコには問題があった。AIモデルを実行するたびに、PCが再起動してしまうのだ。

エラーも出ない。ログも残らない。画面が真っ暗になるだけだ。

彼はデバッグにAIエージェントを使用した。

AIはリモートログを設定したが、ログには何も記録されなかった。

これは、CPUが書き込みを行う暇もないほど、PCが瞬時に落ちていることを証明していた。ハードウェアのリセットだ。

AIは履歴を確認した。マルコは以前、不良のPSUを使っていたことがあった。AIは彼に、新しいものを買うよう勧めた。

マルコは立ち止まった。ある詳細なデータに気づいたのだ。

284ワットの負荷がかかる重いテストでは安定していた。しかし、わずかなリクエストがPCを停止させた。

不良のPSUは高負荷時に故障するものだ。しかし、今回は奇妙な負荷で故障した。

彼はAIに、負荷の形状(load shape)をテストするよう求めた。

彼らはトリガーを突き止めた。部分的なオフロードがスタッターを引き起こし、そのスタッターがマシンを停止させていたのだ。フルオフロードであれば問題なかった。

マルコはハードウェアにお金を使わなかった。設定を一つ変更しただけだ。

システムは2,272回のリクエストにわたって安定したままだった。

あなたへの教訓:

  • 沈黙もデータである。ログが空なら、ソフトウェアより下の層を探せ。
  • トリガーを特定せよ。幽霊を追いかけるのはやめ、実験を行え。
  • 負荷の大きさではなく、負荷の形状をテストせよ。
  • データに違和感を覚えたら、直感を信じろ。

AIは優れたツールだ。高速で、疲れを知らない。しかし、論理の隙間を見つけるのは人間だ。

二人がバグを解決した。

Source: https://dev.to/lenriqueotero/his-ai-said-swap-the-psu-he-said-one-more-test-2i7g Optional learning community: https://t.me/GyaanSetuAi