AI முகவர்கள் இப்போது 16% ஃப்ரீலான்ஸ் வேலைகளைத் தொழில்முறைத் தரத்தில் முடிக்கின்றன

சிக்கலான மற்றும் வணிக ரீதியாக மதிப்புமிக்க பணிகளைக் கையாளுவதில் AI முகவர்கள் காட்டும் அதிகரித்து வரும் திறனால், தொலைதூர உழைப்பு (remote labor) சார்ந்த சூழல் வியக்கத்தக்க வேகத்தில் மாறி வருகிறது. தொழில்முறைத் தரத்திலான ஃப்ரீலான்ஸ் பணிகளுக்கான அதிகபட்ச தானியங்கி விகிதம் (automation rate), எட்டு மாதங்களுக்கும் குறைவான காலத்தில் நான்கு மடங்கு அதிகரித்துள்ளதாகப் புதிய தரவுகள் தெரிவிக்கின்றன.

Remote Labor Index-இன் வேகமான வளர்ச்சி

Scale Labs உடன் இணைந்து Center for AI Safety (CAIS) உருவாக்கிய ஒரு அளவுகோலான Remote Labor Index (RLI), AI முகவர்கள் பணம் செலுத்தும் வாடிக்கையாளர்களுக்கு ஏற்ற தரத்தில், பணம் பெறும் ஃப்ரீலான்ஸ் திட்டங்களை எவ்வளவு அடிக்கடி முடிக்கின்றன என்பதைக் கண்காணிக்கிறது. சாதாரண உரை உருவாக்கம் (text generation) சார்ந்த அளவுகோல்களைப் போலல்லாமல், RLI என்பது 3D/CAD, கட்டிடக்கலை (architecture), கிராஃபிக் டிசைன், வீடியோ அனிமேஷன், ஆடியோ இன்ஜினியரிங் மற்றும் வெப் ஆப் டெவலப்மென்ட் போன்ற முக்கியமான துறைகளில் கவனம் செலுத்துகிறது.

இந்த ஆய்வு, 358 சரிபார்க்கப்பட்ட ஃப்ரீலான்ஸர்களிடமிருந்து பெறப்பட்ட, மொத்தம் $144,000 மதிப்புள்ள 240 திட்டங்களை ஆய்வு செய்தது. இதன் முடிவுகள் திறனில் ஏற்பட்டுள்ள மிகப்பெரிய முன்னேற்றத்தைக் காட்டுகின்றன: வெறும் எட்டு மாதங்களுக்கு முன்பு, அதிகபட்ச தானியங்கி விகிதம் வெறும் 2.5 சதவீதமாக மட்டுமே இருந்தது. இன்று, அது 16.1 சதவீதமாக உயர்ந்துள்ளது.

தானியங்கித் துறையின் புதிய எல்லையில் முன்னணியில் உள்ள Fable 5

சமீபத்திய RLI முடிவுகள் மாடல்களின் செயல்திறனில் ஏற்பட்டுள்ள குறிப்பிடத்தக்க உயர்வைச் சுட்டிக்காட்டுகின்றன, இதில் Fable 5 தற்போதைய தலைவராக உருவெடுத்துள்ளது. Fable 5, 16.1 சதவீத தானியங்கி விகிதத்தை எட்டியது, இது அதன் நெருங்கிய போட்டியாளரான 8.3 சதவீதத்தைப் பெற்ற Opus 4.8-இன் செயல்திறனை விட இரண்டு மடங்கு அதிகம் ஆகும். 6.3 சதவீதத்தை எட்டிய GPT-5.5 மற்ற குறிப்பிடத்தக்க செயல்திறன் கொண்ட மாடல்களில் ஒன்றாகும்.

இந்த விரைவான முன்னேற்றம், சிறப்பு வாய்ந்த ஏஜென்டிக் பணிப்பாய்வுகளின் (agentic workflows) வேகமெடுக்கும் திறனை அடிக்கோடிட்டுக் காட்டுகிறது. இந்த முடிவுகளைப் பெற, சோதனைச் சூழலில் Blender, GIMP மற்றும் Audacity போன்ற 30-க்கும் மேற்பட்ட தொழில்முறை செயலிகளுடன் கூடிய மெய்நிகர் Linux இயந்திரங்கள் பயன்படுத்தப்படுகின்றன. ஒவ்வொரு திட்டத்திற்கும் முகவர்களுக்கு 24 மணிநேரம் வரை கணினி செயலாக்க நேரம் (compute time) வழங்கப்படுகிறது மற்றும் ஒரு "critic loop"-ஐப் பயன்படுத்துகின்றன—இது ஒரு மனித வாடிக்கையாளரின் கோரிக்கைகளை அப்படியே பிரதிபலிக்கும் வகையில், பணிகளை ஆய்வு செய்து திருத்தங்களைச் செய்யத் தூண்டும் ஒரு இரண்டாம் நிலை AI முகவர் ஆகும்.

AI நடுவர்கள் மற்றும் தொழில்முறை மென்பொருட்களின் வரம்புகள்

இந்த முன்னேற்றங்கள் இருந்தபோதிலும், அறிக்கை ஒரு முக்கியமான தடையைக் குறிப்பிடுகிறது: தொழில்முறைத் துல்லியத்தின் "கடைசி மைல்" (last mile) நிலையை எட்ட AI முகவர்கள் இன்னும் போராடுகின்றனர். உதாரணமாக, கட்டிடக்கலை பணிகளில், GPT-5.5 கவர்ச்சிகரமான விஷுவல் ரெண்டர்களை (visual renders) உருவாக்கியது கண்டறியப்பட்டது, ஆனால் அதன் அடிப்படையிலான 3D வடிவியல் (geometry) அடிப்படை ரீதியாகக் குறைபாடுகளுடன் இருந்தது.

இந்த ஆய்வின் ஒரு முக்கிய கண்டுபிடிப்பு என்னவென்றால், AI நடுவர்கள் இன்னும் மனித மதிப்பீட்டாளர்களுக்கு மாற்றாக முடியாது என்பதாகும். சோதனை செய்யப்பட்டபோது, AI நடுவர்கள் மிகவும் தளர்வாகச் செயல்படுவது கண்டறியப்பட்டது; GPT-5.5-க்கு, AI மதிப்பீட்டாளரின் மதிப்பெண், மனிதர்களால் சரிபார்க்கப்பட்ட உண்மையான தரத்தை விட கிட்டத்தட்ட மூன்று மடங்கு அதிகமாக இருந்தது. தொழில்முறைப் பணிகளைத் துல்லியமாகத் தீர்மானிக்க, சிறப்பு மென்பொருட்களுடன் ஆழமாகத் தொடர்பு கொள்ளும் திறன் தேவைப்படுகிறது—இந்தத் துறையில் தற்போதைய AI முகவர்கள் இன்னும் குறிப்பிடத்தக்கத் தடைகளை எதிர்கொள்கின்றனர், எனவேதான் இந்த முரண்பாடு ஏற்படுகிறது.

முகவர்கள் எளிய சாட் இடைமுகங்களிலிருந்து சிக்கலான கிராஃபிக்கல் புரோகிராம்களை இயக்குவது வரை நகரும்போது, டிஜிட்டல் பொருளாதாரத்தில் "வேலை" எவ்வாறு வரையறுக்கப்படுகிறது மற்றும் செயல்படுத்தப்படுகிறது என்பதில் ஒரு அடிப்படை மாற்றத்தை இந்தத் துறை கண்டு வருகிறது.

முக்கியக் குறிப்புகள்

  • முன்நோக்கிய வளர்ச்சி: தொழில்முறை ஃப்ரீலான்ஸ் பணிகளுக்கான அதிகபட்ச தானியங்கி விகிதம் எட்டு மாதங்களுக்கும் குறைவான காலத்தில் 2.5%-லிருந்து 16.1%-ஆக உயர்ந்துள்ளது.
  • மாடல் தலைமை: Fable 5 தற்போது 16.1% தானியங்கி விகிதத்துடன் தொழில்துறையில் முன்னணியில் உள்ளது, இது Opus 4.8 (8.3%) மற்றும் GPT-5.5 (6.3%) ஆகியவற்றை விடச் சிறந்து விளங்குகிறது.
  • மனிதத் தேவை: AI நடுவர்கள் மிகவும் தாராளமாக மதிப்பெண் வழங்கும் போக்கைக் கொண்டிருப்பதாலும், சிறப்பு மென்பொருள் கோப்புகளில் உள்ள கட்டமைப்பு ரீதியான குறைபாடுகளைக் கண்டறியும் திறன் அவர்களிடம் இல்லாததாலும், மனித மதிப்பீட்டாளர்கள் இன்னும் அவசியமானவர்களாகவே உள்ளனர்.