Berita AI: Penentuan Harga Agen, Diagnosis Medis, dan Model-Model China

AI sedang melewati fase demo. Lanskap saat ini terasa berantakan namun praktis. Ini bukan lagi tentang satu peluncuran besar. Ini tentang biaya, kepercayaan, dan kendali.

Berikut adalah pembaruan utamanya:

AI Medis dan Alur Kerja OpenAI sedang mengeksplorasi bagaimana AI membantu dokter mendiagnosis penyakit genetik langka pada anak-anak. Ini bukan tentang menggantikan dokter. Ini tentang membantu mereka menelusuri data genetik dalam jumlah besar. Bagi para pengembang, pelajarannya jelas. Model hanyalah satu bagian. Keberhasilan membutuhkan penyelesaian alur kerja klinis, privasi, dan tanggung jawab hukum.

Tantangan Penentuan Harga Agen Anthropic menunda rencana perubahan penagihan untuk Claude Agent SDK miliknya. Banyak pengguna khawatir akan biaya yang tinggi. Penentuan harga agen sulit karena agen menggunakan banyak token untuk merencanakan, mencoba kembali, dan memperbaiki kesalahan. Jika Anda membangun dengan agen, jangan abaikan biaya. Tambahkan batas pengeluaran. Catat setiap langkah. Tunjukkan kepada pengguna mengapa agen tersebut menghabiskan biaya tersebut.

Benchmark Coding yang Lebih Baik DeepSWE v1.1 merilis pembaruan baru untuk tugas-tugas rekayasa perangkat lunak. Fokusnya adalah pada rekayasa nyata, bukan sekadar terlihat bagus. Ia menguji kode dalam lingkungan yang bersih dan terisolasi. Industri membutuhkan lebih banyak reproduksibilitas dan lebih sedikit trik sulap.

AI Stack yang Terbelah Huawei menggunakan chip miliknya sendiri untuk menyempurnakan model DeepSeek. Ini menunjukkan bahwa China sedang mencari jalan keluar dari keterbatasan perangkat keras. Bagi para pengembang, ini berarti AI stack sedang terbelah. Tim akan lebih peduli tentang di mana model dijalankan dan perangkat keras apa yang mereka gunakan. Model lokal menawarkan kendali, meskipun tidak mengalahkan model frontier terbesar.

Model Ancaman Baru Peneliti keamanan menemukan bahwa penyerang menggunakan alat seperti Claude Code untuk melakukan intrusi. Agen membantu pembela, tetapi mereka juga membantu penyerang mengotomatiskan eksploitasi. Jangan perlakukan agen seperti alat autocomplete sederhana. Perlakukan mereka seperti otomatisasi yang memiliki hak istimewa (privileged automation). Catat tindakan mereka dan batasi kredensial mereka.

Intisarinya: Fase AI berikutnya adalah tentang menyelesaikan masalah biaya dan infrastruktur yang sulit dan membosankan.

Sumber: https://dev.to/damogallagher/ai-news-today-agent-pricing-rare-disease-diagnosis-and-chinas-local-model-push-42c0

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi