AI સમાચાર: એજન્ટ પ્રાઇસિંગ, મેડિકલ ડાયગ્નોસિસ, અને ચીનના મોડલ્સ
AI હવે ડેમો તબક્કાથી આગળ વધી રહ્યું છે. વર્તમાન પરિદ્રશ્ય અસ્તવ્યસ્ત અને વ્યવહારુ છે. હવે તે માત્ર એક મોટા લોન્ચ વિશે નથી. તે ખર્ચ, વિશ્વાસ અને નિયંત્રણ વિશે છે.
અહીં મુખ્ય અપડેટ્સ છે:
મેડિકલ AI અને વર્કફ્લો OpenAI એ તપાસ કરી રહ્યું છે કે AI કેવી રીતે ડોક્ટરોને બાળકોમાં દુર્લભ આનુવંશિક રોગોનું નિદાન કરવામાં મદદ કરે છે. આ ડોક્ટરોનું સ્થાન લેવા વિશે નથી. તે તેમને વિશાળ પ્રમાણમાં આનુવંશિક ડેટા શોધવામાં મદદ કરવા વિશે છે. બિલ્ડર્સ માટે, પાઠ સ્પષ્ટ છે. મોડલ એ માત્ર એક ભાગ છે. સફળતા માટે ક્લિનિકલ વર્કફ્લો, પ્રાઇવસી અને જવાબદારી (liability) ઉકેલવી જરૂરી છે.
એજન્ટ પ્રાઇસિંગના પડકારો Anthropic એ તેના Claude Agent SDK માટેના આયોજિત બિલિંગ ફેરફારને સ્થગિત કર્યો છે. ઘણા વપરાશકર્તાઓને ઊંચા ખર્ચનો ડર હતો. એજન્ટ પ્રાઇસિંગ મુશ્કેલ છે કારણ કે એજન્ટો પ્લાન કરવા, ફરીથી પ્રયાસ કરવા અને ભૂલો સુધારવા માટે ઘણા ટોકન્સનો ઉપયોગ કરે છે. જો તમે એજન્ટ્સ સાથે નિર્માણ કરો છો, તો ખર્ચને અવગણશો નહીં. ખર્ચની મર્યાદા (spend limits) ઉમેરો. દરેક સ્ટેપ લોગ કરો. વપરાશકર્તાઓને બતાવો કે એજન્ટે પૈસા શા માટે ખર્ચ્યા.
બહેતર કોડિંગ બેન્ચમાર્કસ DeepSWE v1.1 એ સોફ્ટવેર એન્જિનિયરિંગ કાર્યો માટે નવા અપડેટ્સ બહાર પાડ્યા છે. તે માત્ર દેખાવ સુધારવાને બદલે વાસ્તવિક એન્જિનિયરિંગ પર ધ્યાન કેન્દ્રિત કરે છે. તે ક્લીન અને અલગ (isolated) વાતાવરણમાં કોડનું પરીક્ષણ કરે છે. ઉદ્યોગને વધુ રિપ્રોડ્યુસિબિલિટી (reproducibility) અને ઓછા 'મેજિક ટ્રિક્સ'ની જરૂર છે.
સ્પ્લિટ AI સ્ટેક Huawei એ DeepSeek મોડલ્સને રિફાઇન કરવા માટે તેના પોતાના ચિપ્સનો ઉપયોગ કર્યો છે. આ દર્શાવે છે કે ચીન હાર્ડવેરની મર્યાદાઓને પાર કરવા માટે કામ કરી રહ્યું છે. બિલ્ડર્સ માટે, આનો અર્થ એ છે કે AI સ્ટેક વિભાજિત થઈ રહ્યું છે. ટીમો હવે મોડલ્સ ક્યાં ચાલે છે અને તેઓ કયા હાર્ડવેરનો ઉપયોગ કરે છે તેના પર વધુ ધ્યાન આપશે. લોકલ મોડલ્સ નિયંત્રણ આપે છે, ભલે તેઓ સૌથી મોટા ફ્રન્ટિયર મોડલ્સને હરાવી ન શકે.
નવું થ્રેટ મોડલ સુરક્ષા સંશોધકોએ શોધી કાઢ્યું છે કે હુમલાખોરો ઘૂસણખોરી કરવા માટે Claude Code જેવા સાધનોનો ઉપયોગ કરે છે. એજન્ટો ડિફેન્ડર્સને મદદ કરે છે, પરંતુ તેઓ હુમલાખોરોને એક્સપ્લોઇટ્સ (exploits) ઓટોમેટ કરવા માટે પણ મદદ કરે છે. એજન્ટ્સને સાદા ઓટોકમ્પ્લીટ ટૂલ્સની જેમ ન ગણો. તેમને પ્રિવિલેજ્ડ ઓટોમેશન (privileged automation) તરીકે ગણો. તેમની ક્રિયાઓ લોગ કરો અને તેમની ક્રેડેન્શિયલ્સ (credentials) પર પ્રતિબંધ મૂકો.
મુખ્ય વાત: AI નો આગામી તબક્કો ખર્ચ અને ઇન્ફ્રાસ્ટ્રક્ચરની મુશ્કેલ અને કંટાળાજનક સમસ્યાઓ ઉકેલવા વિશે છે.
વૈકલ્પિક લર્નિંગ કોમ્યુનિટી: https://t.me/GyaanSetuAi