AIは「PSUを交換しろ」と言い、彼は「もう一度テストを」と言った
マルコには問題があった。AIモデルを実行するたびに、PCが再起動してしまうのだ。
エラーも出ない。ログも残らない。画面が真っ暗になるだけだ。
彼はデバッグにAIエージェントを使用した。
AIはリモートログを設定したが、ログには何も記録されなかった。
これは、CPUが書き込みを行う暇もないほど、PCが瞬時に落ちていることを証明していた。ハードウェアのリセットだ。
AIは履歴を確認した。マルコは以前、不良のPSUを使っていたことがあった。AIは彼に、新しいものを買うよう勧めた。
マルコは立ち止まった。ある詳細なデータに気づいたのだ。
284ワットの負荷がかかる重いテストでは安定していた。しかし、わずかなリクエストがPCを停止させた。
不良のPSUは高負荷時に故障するものだ。しかし、今回は奇妙な負荷で故障した。
彼はAIに、負荷の形状(load shape)をテストするよう求めた。
彼らはトリガーを突き止めた。部分的なオフロードがスタッターを引き起こし、そのスタッターがマシンを停止させていたのだ。フルオフロードであれば問題なかった。
マルコはハードウェアにお金を使わなかった。設定を一つ変更しただけだ。
システムは2,272回のリクエストにわたって安定したままだった。
あなたへの教訓:
- 沈黙もデータである。ログが空なら、ソフトウェアより下の層を探せ。
- トリガーを特定せよ。幽霊を追いかけるのはやめ、実験を行え。
- 負荷の大きさではなく、負荷の形状をテストせよ。
- データに違和感を覚えたら、直感を信じろ。
AIは優れたツールだ。高速で、疲れを知らない。しかし、論理の隙間を見つけるのは人間だ。
二人がバグを解決した。
Source: https://dev.to/lenriqueotero/his-ai-said-swap-the-psu-he-said-one-more-test-2i7g Optional learning community: https://t.me/GyaanSetuAi