AI News: Cenniki Agentów, Diagnostyka Medyczna i Modele Chin

AI wychodzi z fazy demonstracyjnej. Obecny krajobraz jest chaotyczny i praktyczny. Nie chodzi już o jedną wielką premierę. Chodzi o koszty, zaufanie i kontrolę.

Oto najważniejsze aktualizacje:

AI w medycynie i workflow OpenAI bada, jak AI pomaga lekarzom diagnozować rzadkie choroby genetyczne u dzieci. Nie chodzi o zastępowanie lekarzy, lecz o pomoc w przeszukiwaniu ogromnych ilości danych genetycznych. Dla twórców lekcja jest jasna: model to tylko jeden element. Sukces wymaga rozwiązania kwestii klinicznych workflow, prywatności i odpowiedzialności prawnej.

Wyzwania związane z wyceną agentów Anthropic wstrzymało planowaną zmianę rozliczeń dla swojego Claude Agent SDK. Wielu użytkowników obawiało się wysokich kosztów. Wycena agentów jest trudna, ponieważ agenci zużywają wiele tokenów na planowanie, ponawianie prób i naprawianie błędów. Jeśli budujesz rozwiązania oparte na agentach, nie ignoruj kosztów. Dodaj limity wydatków. Loguj każdy krok. Pokazuj użytkownikom, dlaczego agent wydał pieniądze.

Lepsze benchmarki kodowania DeepSWE v1.1 wprowadziło nowe aktualizacje dla zadań z zakresu inżynierii oprogramowania. Skupia się ono na rzeczywistej inżynierii, a nie tylko na "dobrym wyglądzie". Testuje kod w czystych, odizolowanych środowiskach. Branża potrzebuje większej powtarzalności i mniej "magicznych sztuczek".

Podział stosu AI Huawei wykorzystało własne chipy do udoskonalenia modeli DeepSeek. Pokazuje to, że Chiny radzą sobie z ograniczeniami sprzętowymi. Dla twórców oznacza to, że stos AI ulega podziałowi. Zespoły będą bardziej zwracać uwagę na to, gdzie uruchamiane są modele i jakiego sprzętu używają. Modele lokalne oferują kontrolę, nawet jeśli nie pokonują największych modeli typu frontier.

Nowy model zagrożeń Badacze bezpieczeństwa odkryli, że atakujący używają narzędzi takich jak Claude Code do przeprowadzania włamań. Agenci pomagają obrońcom, ale pomagają także atakującym w automatyzacji exploitów. Nie traktuj agentów jak prostych narzędzi do autouzupełniania. Traktuj ich jak uprzywilejowaną automatyzację. Loguj ich działania i ograniczaj ich poświadczenia.

Wniosek: Następna faza AI polega na rozwiązywaniu trudnych, nudnych problemów związanych z kosztami i infrastrukturą.

Źródło: https://dev.to/damogallagher/ai-news-today-agent-pricing-rare-disease-diagnosis-and-chinas-local-model-push-42c0

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi