𝗔𝗜 𝗡𝗲𝘄𝘀: 𝗔𝗴𝗲𝗻𝘁 𝗣𝗿𝗶𝗰𝗶𝗻𝗴, 𝗠𝗲𝗱𝗶𝗰𝗮𝗹 𝗗𝗶𝗮𝗴𝗻𝗼𝘀𝗶𝘀, 𝗮𝗻𝗱 𝗖𝗵𝗶𝗻𝗮'𝘀 𝗠𝗼𝗱𝗲𝗹𝘀

هوش مصنوعی از مرحله نمایش (demo) فراتر می‌رود. فضای فعلی، پیچیده و کاربردی است. موضوع دیگر تنها یک عرضه بزرگ نیست؛ بلکه بحث هزینه، اعتماد و کنترل است.

در اینجا به‌روزرسانی‌های کلیدی آورده شده است:

هوش مصنوعی پزشکی و جریان کاری (Workflow) OpenAI در حال بررسی این موضوع است که چگونه هوش مصنوعی به پزشکان در تشخیص بیماری‌های ژنتیکی نادر در کودکان کمک می‌کند. هدف جایگزینی پزشکان نیست، بلکه کمک به آن‌ها برای جستجو در حجم عظیمی از داده‌های ژنتیکی است. برای سازندگان، درس واضح است: مدل تنها یک بخش از ماجراست. موفقیت مستلزم حل چالش‌های جریان‌های کاری بالینی، حریم خصوصی و مسئولیت‌پذیری است.

چالش‌های قیمت‌گذاری عامل‌ها (Agent Pricing) Anthropic تغییر برنامه‌ریزی‌شده در سیستم صورت‌حساب Claude Agent SDK خود را متوقف کرد. بسیاری از کاربران از هزینه‌های بالا بیم داشتند. قیمت‌گذاری عامل‌ها دشوار است زیرا آن‌ها از توکن‌های زیادی برای برنامه‌ریزی، تلاش مجدد و رفع خطاها استفاده می‌کنند. اگر با استفاده از عامل‌ها محصولی می‌سازید، هزینه‌ها را نادیده نگیرید. محدودیت‌های هزینه تعیین کنید. هر مرحله را ثبت (Log) کنید. به کاربران نشان دهید که چرا عامل چنین هزینه‌ای داشته است.

بنچمارک‌های کدنویسی بهتر نسخه v1.1 از DeepSWE به‌روزرسانی‌های جدیدی را برای وظایف مهندسی نرم‌افزار منتشر کرد. تمرکز این نسخه بر مهندسی واقعی است، نه صرفاً ظاهر خوب. این ابزار کد را در محیط‌های تمیز و ایزوله آزمایش می‌کند. صنعت به بازتولیدپذیری (reproducibility) بیشتر و ترفندهای جادویی کمتر نیاز دارد.

شکاف در پشته (Stack) هوش مصنوعی Huawei از تراشه‌های خود برای بهبود مدل‌های DeepSeek استفاده کرد. این نشان می‌دهد که چین در حال دور زدن محدودیت‌های سخت‌افزاری است. برای سازندگان، این بدان معناست که پشته هوش مصنوعی در حال تقسیم شدن است. تیم‌ها بیشتر به این موضوع اهمیت خواهند داد که مدل‌ها کجا اجرا می‌شوند و از چه سخت‌افزاری استفاده می‌کنند. مدل‌های محلی کنترل بیشتری ارائه می‌دهند، حتی اگر نتوانند با بزرگترین مدل‌های پیشرو (frontier models) رقابت کنند.

مدل تهدید جدید محققان امنیتی دریافتند که مهاجمان از ابزارهایی مانند Claude Code برای انجام نفوذ استفاده می‌کنند. عامل‌ها به مدافعان کمک می‌کنند، اما به مهاجمان نیز کمک می‌کنند تا اکسپلویت‌ها (exploits) را خودکارسازی کنند. با عامل‌ها مانند ابزارهای ساده تکمیل خودکار (autocomplete) رفتار نکنید؛ بلکه با آن‌ها مانند اتوماسیون دارای سطح دسترسی (privileged automation) برخورد کنید. اقدامات آن‌ها را ثبت کنید و دسترسی‌هایشان را محدود نمایید.

نکته اصلی: مرحله بعدی هوش مصنوعی، حل مشکلات سخت و خسته‌کننده مربوط به هزینه و زیرساخت است.

Source: https://dev.to/damogallagher/ai-news-today-agent-pricing-rare-disease-diagnosis-and-chinas-local-model-push-42c0

Optional learning community: https://t.me/GyaanSetuAi