𝗔𝗜 𝗡𝗲𝘄𝘀: 𝗔𝗴𝗲𝗻𝘁 𝗣𝗿𝗶𝗰𝗶𝗻𝗴, 𝗠𝗲𝗱𝗶𝗰𝗮𝗹 𝗗𝗶𝗮𝗴𝗻𝗼𝘀𝗶𝘀, 𝗮𝗻𝗱 𝗖𝗵𝗶𝗻𝗮'𝘀 𝗠𝗼𝗱𝗲𝗹𝘀

Translated for your language. Read the original.

AI-assisted draft.

ഇന്നലെ2min read

AI ഡെമോ ഘട്ടത്തിന് അപ്പുറത്തേക്ക് നീങ്ങുകയാണ്. നിലവിലെ സാഹചര്യം സങ്കീർണ്ണവും പ്രായോഗികവുമാണ്. ഇത് ഇനി ഒരു വലിയ ലോഞ്ചിനെക്കുറിച്ച് മാത്രമല്ല; മറിച്ച് ചിലവ്, വിശ്വാസം, നിയന്ത്രണം എന്നിവയെക്കുറിച്ചാണ്.

പ്രധാന അപ്‌ഡേറ്റുകൾ താഴെ പറയുന്നവയാണ്:

Medical AI and Workflow കുട്ടികളിലെ അപൂർവ്വ ജനിതക രോഗങ്ങൾ നിർണ്ണയിക്കാൻ AI ഡോക്ടർമാരെ എങ്ങനെ സഹായിക്കുന്നു എന്ന് OpenAI പര്യവേക്ഷണം ചെയ്യുന്നു. ഇത് ഡോക്ടർമാരെ മാറ്റിസ്ഥാപിക്കാനല്ല; മറിച്ച് വൻതോതിലുള്ള ജനിതക ഡാറ്റ പരിശോധിക്കാൻ അവരെ സഹായിക്കാനാണ്. നിർമ്മാതാക്കളെ സംബന്ധിച്ചിടത്തോളം പാഠം വ്യക്തമാണ്. മോഡൽ എന്നത് ഒരു ഭാഗം മാത്രമാണ്. ക്ലിനിക്കൽ വർക്ക്ഫ്ലോകൾ, സ്വകാര്യത, ബാധ്യതകൾ എന്നിവ പരിഹരിക്കുമ്പോഴാണ് വിജയം കൈവരിക്കാൻ കഴിയുന്നത്.

Agent Pricing Challenges Anthropic അതിന്റെ Claude Agent SDK-യുടെ പ്ലാൻ ചെയ്ത ബില്ലിംഗ് മാറ്റം നിർത്തിവെച്ചു. ഉയർന്ന ചിലവ് വരുമെന്ന് പല ഉപഭോക്താക്കളും ഭയപ്പെട്ടിരുന്നു. ഏജന്റുകൾ പ്ലാൻ ചെയ്യാനും, വീണ്ടും ശ്രമിക്കാനും (retry), പിശകുകൾ പരിഹരിക്കാനും ധാരാളം ടോക്കണുകൾ ഉപയോഗിക്കുന്നതിനാൽ ഏജന്റ് പ്രൈസിംഗ് പ്രയാസകരമാണ്. നിങ്ങൾ ഏജന്റുകൾ ഉപയോഗിച്ച് നിർമ്മാണം നടത്തുകയാണെങ്കിൽ, ചിലവ് അവഗണിക്കരുത്. ചിലവ് പരിധികൾ (spend limits) നിശ്ചയിക്കുക. ഓരോ ഘട്ടവും ലോഗ് ചെയ്യുക. ഏജന്റ് എന്തുകൊണ്ടാണ് പണം ചിലവാക്കിയതെന്ന് ഉപഭോക്താക്കളെ കാണിക്കുക.

Better Coding Benchmarks സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗ് ജോലികൾക്കായി DeepSWE v1.1 പുതിയ അപ്‌ഡേറ്റുകൾ പുറത്തിറക്കി. ഇത് വെറുതെ കാണാൻ നല്ലതാകുന്നതിനേക്കാൾ യഥാർത്ഥ എഞ്ചിനീയറിംഗിലാണ് ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. വൃത്തിയുള്ളതും ഒറ്റപ്പെട്ടതുമായ (isolated) സാഹചര്യങ്ങളിൽ ഇത് കോഡ് പരിശോധിക്കുന്നു. വ്യവസായത്തിന് കൂടുതൽ പുനരുൽപ്പാദനക്ഷമതയും (reproducibility) കുറഞ്ഞ മാന്ത്രിക വിദ്യകളുമാണ് ആവശ്യം.

The Split AI Stack DeepSeek മോഡലുകൾ മെച്ചപ്പെടുത്താൻ Huawei സ്വന്തം ചിപ്പുകൾ ഉപയോഗിച്ചു. ഹാർഡ്‌വെയർ പരിമിതികളെ മറികടക്കാൻ ചൈന ശ്രമിക്കുന്നുണ്ടെന്ന് ഇത് കാണിക്കുന്നു. നിർമ്മാതാക്കളെ സംബന്ധിച്ചിടത്തോളം, AI സ്റ്റാക്ക് വിഭജിക്കപ്പെടുന്നു എന്നാണ് ഇതിനർത്ഥം. മോഡലുകൾ എവിടെ പ്രവർത്തിക്കുന്നുവെന്നും അവ ഏത് ഹാർഡ്‌വെയർ ഉപയോഗിക്കുന്നുവെന്നും ടീമുകൾ കൂടുതൽ ശ്രദ്ധിക്കും. ലോക്കൽ മോഡലുകൾ ഏറ്റവും വലിയ ഫ്രണ്ടിയർ മോഡലുകളെ മറികടന്നില്ലെങ്കിൽ പോലും അവ നിയന്ത്രണം നൽകുന്നു.

The New Threat Model ആക്രമണകാരികൾ കടന്നുകയറ്റങ്ങൾ നടത്താൻ Claude Code പോലുള്ള ടൂളുകൾ ഉപയോഗിക്കുന്നുണ്ടെന്ന് സുരക്ഷാ ഗവേഷകർ കണ്ടെത്തി. ഏജന്റുകൾ പ്രതിരോധിക്കുന്നവരെ സഹായിക്കുന്നുണ്ടെങ്കിലും, ആക്രമണകാരികൾക്ക് എക്സ്പ്ലോയിറ്റുകൾ ഓട്ടോമേറ്റ് ചെയ്യാനും അവ സഹായിക്കുന്നു. ഏജന്റുകളെ വെറും ഓട്ടോ കംപ്ലീറ്റ് ടൂളുകളായി കാണരുത്. അവയെ പ്രത്യേക അധികാരങ്ങളുള്ള ഓട്ടോമേഷൻ (privileged automation) ആയി പരിഗണിക്കുക. അവയുടെ പ്രവർത്തനങ്ങൾ ലോഗ് ചെയ്യുകയും ക്രെഡൻഷ്യലുകൾ നിയന്ത്രിക്കുകയും ചെയ്യുക.

ചുരുക്കത്തിൽ: AI-യുടെ അടുത്ത ഘട്ടം ചിലവ്, ഇൻഫ്രാസ്ട്രക്ചർ എന്നിവയുടെ പ്രയാസമേറിയതും വിരസവുമായ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിനെക്കുറിച്ചാണ്.

Source: https://dev.to/damogallagher/ai-news-today-agent-pricing-rare-disease-diagnosis-and-chinas-local-model-push-42c0

Optional learning community: https://t.me/GyaanSetuAi

𝗔𝗜 𝗡𝗲𝘄𝘀: 𝗔𝗴𝗲𝗻𝘁 𝗣𝗿𝗶𝗰𝗶𝗻𝗴, 𝗠𝗲𝗱𝗶𝗰𝗮𝗹 𝗗𝗶𝗮𝗴𝗻𝗼𝘀𝗶𝘀, 𝗮𝗻𝗱 𝗖𝗵𝗶𝗻𝗮'𝘀 𝗠𝗼𝗱𝗲𝗹𝘀

Continue reading

𝗦𝗰𝗮𝗹𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗪𝗼𝗿𝗸𝗳𝗹𝗼𝘄𝘀

ഡൊമെയ്ൻ സ്പെസിഫിക് AI ഏജന്റുകൾ: 2026-ലേക്കുള്ള ഒരു വഴികാട്ടി

𝗔𝗜 𝗡𝗲𝘄𝘀 𝗔𝗿𝗰𝗵𝗶𝘃𝗲: 𝗝𝘂𝗻𝗲 𝟭𝟳, 𝟮𝟬𝟮𝟲

𝗔𝗜 𝗡𝗲𝘄𝘀 𝗔𝗿𝗰𝗵𝗶𝘃𝗲: 𝗝𝘂𝗻𝗲 𝟭𝟱, 𝟮𝟬𝟮𝟲

ചൈനീസ് എഐ ലാബുകൾ തമ്മിലുള്ള വിലയുദ്ധം