Mawakala wa AI Sasa Wanatimiza 16% ya Kazi za Freelance kwa Ubora wa Kitaalamu

Translated for your language. Read the original.

AI-assisted draft.

In this article

Wakala wa AI Sasa Wanatimiza 16% ya Kazi za Freelance kwa Ubora wa Kitaalamu

Mazingira ya kazi za mbali (remote labor) yanabadilika kwa kasi ya kutisha huku wakala wa AI wakionyesha uwezo unaoongezeka wa kushughulikia kazi tata na zenye thamani ya kibiashara. Takwimu mpya zinaonyesha kuwa kiwango cha juu cha otomatiki (automation rate) kwa kazi za freelance za kiwango cha kitaalamu kimeongezeka mara nne katika kipindi cha chini ya miezi minane.

Kupanda kwa Kasi kwa Remote Labor Index

Remote Labor Index (RLI), kipimo kilichoundwa na Center for AI Safety (CAIS) kwa kushirikiana na Scale Labs, hufuatilia jinsi wakala wa AI wanavyokamilisha miradi ya freelance ya kulipwa kwa kiwango cha ubora kinachokubalika na wateja wanaolipa. Tofauti na vipimo vya kawaida vya uundaji wa maandishi, RLI inazingatia nyanja zenye hatari kubwa ikiwa ni pamoja na 3D/CAD, usanifu (architecture), usanifu wa michoro (graphic design), uhuishaji wa video (video animation), uhandisi wa sauti (audio engineering), na uundaji wa programu za wavuti (web app development).

Utafiti huo ulichambua miradi 240 yenye thamani ya jumla ya $144,000, iliyotolewa kutoka kwa wafanyakazi huru (freelancers) 358 walioidhinishwa. Matokeo yanaonyesha ongezeko kubwa la uwezo: miezi minane iliyopita tu, kiwango cha juu cha otomatiki kilikuwa ni asilimia 2.5 pekee. Leo, kiwango hicho kimepanda hadi asilimia 16.1.

Fable 5 Inaongoza Mapinduzi Mapya ya Otomatiki

Matokeo ya hivi karibuni ya RLI yanaonyesha ongezeko kubwa katika utendaji wa modeli, huku Fable 5 ikitokea kama kiongozi wa sasa. Fable 5 ilifikia kiwango cha otomatiki cha asilimia 16.1, ikiwa imezidisha mara mbili utendaji wa mshindani wake wa karibu, Opus 4.8, aliyepata asilimia 8.3. Wengine wenye utendaji mzuri ni pamoja na GPT-5.5, iliyofikia asilimia 6.3.

Maendeleo haya ya haraka yanasisitiza uwezo unaoongezeka wa mifumo ya kazi ya wakala (agentic workflows) iliyobobea. Ili kufikia matokeo haya, mazingira ya majaribio yanatumia mashine za Linux za kidijitali (virtual Linux machines) zilizowekwa programu zaidi ya 30 za kitaalamu, kama vile Blender, GIMP, na Audacity. Wakala wanapewa hadi saa 24 za muda wa kompyuta kwa kila mradi na hutumia "critic loop"—wakala mwingine wa AI anayekagua na kutoa maelekezo ya marekebisho ili kuiga tabia ya mteja wa binadamu mwenye mahitaji makali.

Mapungufu ya Majaji wa AI na Programu za Kitaalamu

Licha ya mafanikio haya, ripoti hiyo inaangazia kikwazo muhimu: wakala wa AI bado wanapata shida na "hatua ya mwisho" (last mile) ya usahihi wa kitaalamu. Katika kazi za usanifu, kwa mfano, GPT-5.5 iligundulika kuwa imetengeneza picha za kuvutia (visual renders) wakati jiometri ya 3D iliyokuwa chini yake ilibaki na kasoro za msingi.

Ugunduzi muhimu wa utafiti huo ni kwamba majaji wa AI bado hawawezi kuchukua nafasi ya waevalu wa binadamu. Wakipimwa, majaji wa AI walionekana kuwa na upole uliopitiliza; kwa GPT-5.5, alama ya mweevalu wa AI ilikuwa karibu mara tatu zaidi ya ubora uliothibitishwa na binadamu. Tofauti hii ipo kwa sababu kutathmini kazi ya kitaalamu kwa ukweli kunahitaji uwezo wa kuingiliana kwa kina na programu maalum—eneo ambalo wakala wa AI wa sasa bado wanakabiliwa na vikwazo vikubwa.

Wakati wakala wanapohamia kutoka kwenye mifumo rahisi ya mazungumzo (chat interfaces) hadi kuendesha programu tata za picha (graphical programs), sekta hii inashuhudia mabadiliko ya msingi katika jinsi "kazi" inavyofafanuliwa na kutekelezwa katika uchumi wa kidijitali.

Mambo Muhimu ya Kuzingatia

Ukuaji wa Kasi ya Ajabu: Kiwango cha juu cha otomatiki kwa kazi za freelance za kitaalamu kimepata ongezeko kutoka 2.5% hadi 16.1% katika kipindi cha chini ya miezi minane.
Uongozi wa Modeli: Fable 5 kwa sasa inaongoza sekta hii ikiwa na kiwango cha otomatiki cha 16.1%, ikifanya vizuri zaidi kuliko Opus 4.8 (8.3%) na GPT-5.5 (6.3%).
Uhitaji wa Binadamu: Waevalu wa binadamu wanabaki kuwa muhimu, kwani majaji wa AI huwa na ukarimu uliopitiliza na hukosa uwezo wa kugundua kasoro za kimuundo katika faili za programu maalum.

Mawakala wa AI Sasa Wanatimiza 16% ya Kazi za Freelance kwa Ubora wa Kitaalamu

Wakala wa AI Sasa Wanatimiza 16% ya Kazi za Freelance kwa Ubora wa Kitaalamu

Kupanda kwa Kasi kwa Remote Labor Index

Fable 5 Inaongoza Mapinduzi Mapya ya Otomatiki

Mapungufu ya Majaji wa AI na Programu za Kitaalamu

Mambo Muhimu ya Kuzingatia

Continue reading

Kipimo kipya cha AA Briefcase kinafunua mapambano ya AI katika kazi halisi za maarifa

Kupanda kwa AI ya Agentic: Kwa nini Timu za Kiteknolojia zinaongoza katika mipaka ya otomatiki

Kwa nini Viwango vya Kawaida vya Upimaji wa AI Vinapunguza Thamani ya Uwezo wa Mawakala Kimfumo