துல்லியமான பொறியியல் மூலம் LLM மாயத்தோற்றங்களை எதிர்கொள்ள Probably நிறுவனம் $9 மில்லியன் திரட்டுகிறது
பெரிய மொழி மாதிரிகள் (LLMs) தொழில்முறை பணிப்பாய்வுகளில் பெருகிவரும் வகையில் ஒருங்கிணைக்கப்பட்டு வரும் நிலையில், இந்தத் துறை ஒரு தொடர்ச்சியான தடையை எதிர்கொள்கிறது: மிகவும் மேம்பட்ட மாதிரிகள் கூட மாயத்தோற்றங்களை (hallucinate) உருவாக்கும் போக்கு. ஸ்டார்ட்அப் நிறுவனமான Probably, AI நம்பகத்தன்மைக்கான மிகவும் கடுமையான மற்றும் தீர்மானிக்கப்பட்ட (deterministic) அணுகுமுறையை உருவாக்க, Andreessen Horowitz தலைமையிலான $9 மில்லியன் விதை நிதியைப் (seed funding) பெற்று, இந்த சவாலை நேரடியாக எதிர்கொள்கிறது.
99.99% துல்லியத்தை நோக்கி நகர்தல்
நிறுவனர் Peter Elias தலைமையிலான Probably நிறுவனத்தின் முக்கிய நோக்கம், LLM-களின் நிகழ்தகவுத் தன்மைக்கும் (probabilistic nature), தீர்மானிக்கப்பட்ட அமைப்புகளிடமிருந்து (deterministic systems) எதிர்பார்க்கப்படும் 99.99% துல்லியத் தரத்திற்கும் இடையிலான இடைவெளியைக் குறைப்பதாகும். அதிக முக்கியத்துவம் வாய்ந்த சூழல்களில், ஒரு சிறிய உண்மைத் தவறு கூட ஒரு AI கருவியை பயனற்றதாக்கிவிடும். இதைத் தீர்க்க, துல்லியம் என்பது வெறும் மாதிரியின் அளவைப் பொறுத்தது என்ற கருத்திலிருந்து விலகி, "harness engineering" என்பதில் Probably கவனம் செலுத்தி வருகிறது.
இந்த நிறுவனத்தின் முதன்மைத் தயாரிப்பு, சிக்கலான தரவுத் தொகுப்புகளிலிருந்து நுண்ணறிவுகளைப் பெறுவதற்காக வடிவமைக்கப்பட்ட ஒரு தரவு அறிவியல் கருவியாகும். உரையாடல் பதில்களை வழங்கும் சாதாரண சாட்பாட்களைப் போலல்லாமல், Probably-இன் கருவி ஒவ்வொரு பதிலையும் ஒரு குறிப்பிட்ட மேற்கோளுடன் (citation) மற்றும் வெளிப்படையான தணிக்கைப் பாதையுடன் (audit trail) வழங்குகிறது, இது பயனர்கள் ஒவ்வொரு வெளியீட்டிற்குப் பின்னாலுள்ள தர்க்கத்தையும் சரிபார்க்க அனுமதிக்கிறது.
"Data Science Mech Suit" கட்டமைப்பு
ஒரு மிகப்பெரிய மாதிரியின் பகுத்தறியும் திறனை மட்டுமே நம்பியிருக்காமல், Elias "data science mech suit" என்று அழைக்கும் முறையை Probably பயன்படுத்துகிறது. இந்த கட்டமைப்பு ஒரு விரிவான ஹார்னஸ் அமைப்பாக (harness system) செயல்படுகிறது, இதில் LLM-இன் ஆரம்ப வெளியீடு உடனடியாக ஒரு தீர்மானிக்கப்பட்ட சரிபார்ப்பியால் (deterministic validator) ஆய்வு செய்யப்படுகிறது.
LLM ஒரு முடிவை வழங்கும்போது அது அடிப்படை தரவுத் தொகுப்புடன் சரியாகப் பொருந்தவில்லை என்றால், சரிபார்ப்பி அதை நிராகரிக்கிறது. முக்கியமாக, இந்த சரிபார்ப்பிக்கு எதிராகவே LLM சிறப்பாகப் பயிற்சியளிக்கப்படுகிறது, இது வேகம் மற்றும் உண்மைத் தன்மைக்காக மேம்படுத்தப்பட்ட ஒரு மூடிய-சுற்று அமைப்பை (closed-loop system) உருவாக்குகிறது. இந்த அணுகுமுறை ஒரு அடிப்படைத் தத்துவத்தின் அடிப்படையில் செயல்படுகிறது: பொறியியல் மூலம் சூழலைச் செம்மைப்படுத்துவதன் மூலமும், தெளிவற்ற தன்மையைக் குறைப்பதன் மூலமும், மிகப்பெரிய கணக்கீட்டுத் திறன் (computational brute force) இல்லாமலேயே மாதிரியை "சரியானதைச் செய்ய" தூண்ட முடியும்.
சிறிய, உள்ளூர் மாதிரிகள் மூலம் செயல்திறன்
Probably-இன் அணுகுமுறையின் மிக முக்கியமான தொழில்நுட்பத் தாக்கங்களில் ஒன்று, சிறிய மற்றும் அதிக திறன் கொண்ட மாதிரிகளைப் பயன்படுத்தும் හැකියையாகும். "mech suit" சரிபார்ப்பு மற்றும் சூழல் செம்மைப்படுத்துதலின் கடினமான பணிகளைக் கையாளுவதால், இந்த அமைப்பு "frontier மாதிரிகளை விட நான்கு நிலைகள் பலவீனமான" மாதிரிகளிலும் இயங்க முடியும்.
இந்த மாற்றம் மிகப்பெரிய பொருளாதார மற்றும் செயல்பாட்டு நன்மைகளைக் கொண்டுள்ளது:
- குறைக்கப்பட்ட டோக்கன் செலவுகள்: சிறிய மாடல்கள் ஒரு வினவலுக்கான (per-query) செலவை கணிசமாகக் குறைக்கின்றன; நிறுவனங்கள் தங்கள் AI பட்ஜெட்களை மேம்படுத்த முயலும்போது இது ஒரு முக்கியமான காரணியாகும்.
- உள்ளூர் இயக்கம் (Local Execution): இந்த இலகுவான மாடல்களை, விலையுயர்ந்த மற்றும் அதிக தாமதத்தைக் கொண்ட (high-latency) தரவு மையத் தொடர்புகளுக்குப் பதிலாக, டெஸ்க்டாப் கணினிகள் போன்ற உள்ளூர் வன்பொருள்களில் இயக்க முடியும்.
- அளவிடக்கூடிய தன்மை (Scalability): இந்த எஞ்சின், தரவு அறிவியலைத் தாண்டி கணக்கியல் மற்றும் மருத்துவச் சேவைகள் போன்ற துல்லியம் சார்ந்த துறைகளுக்கும் விரிவுபடுத்தும் வகையில் வடிவமைக்கப்பட்டுள்ளது.
பெரிய AI ஆய்வகங்களின் ஊக்க மாதிரிக்கு (Incentive Model) சவால் விடுத்தல்
தற்போதைய AI சூழலில் உள்ள ஒரு கட்டமைப்பு ரீதியான முரண்பாட்டை எலியாஸ் சுட்டிக்காட்டுகிறார்: பெரிய AI ஆய்வகங்கள், அடிக்கடி பயனர்களின் திருத்தங்களைச் சரிபார்க்க வேண்டியிருக்கும் வகையிலான பிரம்மாண்டமான, பொதுப் பயன்பாட்டு மாடல்களை உருவாக்கத் தூண்டப்படுகின்றன. இந்த ஆய்வகங்கள் பெரும்பாலும் டோக்கன் பயன்பாட்டின் அடிப்படையில் கட்டணம் வசூலிப்பதால், அதிக பிழைகளும், அதைத் தொடர்ந்து வரும் கூடுதல் வினவல்களும் உண்மையில் வருவாயை அதிகரிக்கக்கூடும். அளவை (scale) அதிகரிப்பதற்குப் பதிலாக, பொறியியல் மூலம் துல்லியத்தில் கவனம் செலுத்துவதன் மூலமும், "தெளிவற்ற தன்மையைக் குறைப்பதன்" (reducing ambiguity) மூலமும், நம்பகத்தன்மை மட்டுமே முக்கிய அளவுகோலாக இருக்கும் முக்கியமான AI பயன்பாடுகளுக்கான ஒரு தனித்துவமான இடத்தைப் Probably உருவாக்கி வருகிறது.
முக்கியக் கருத்துக்கள்
- நிச்சயமான சரிபார்ப்பு (Deterministic Validation): Probably, 99.99% துல்லியத்தை இலக்காகக் கொண்டு, LLM வெளியீடுகளை ஒரு 'deterministic validator'-உடன் ஒப்பிட்டுச் சரிபார்க்க "mech suit" கட்டமைப்பைப் பயன்படுத்துகிறது.
- செலவு குறைந்த பொறியியல்: சிறந்த சூழல் பொறியியல் (context engineering) மூலம் தெளிவற்ற தன்மையைக் குறைப்பதன் மூலம், இந்த அமைப்பை உள்ளூர் வன்பொருள்களில் இயங்கக்கூடிய மிகச் சிறிய மற்றும் மலிவான மாடல்களில் இயக்க முடியும்.
- துல்லியத்திற்கு முன்னுரிமை: தவறான தகவல்கள் (hallucinations) ஏற்றுக்கொள்ள முடியாத மருத்துவம் மற்றும் நிதி போன்ற அதிக முக்கியத்துவம் வாய்ந்த, துல்லியம் சார்ந்த துறைகளுக்கு AI-ஐக் கொண்டு செல்லும் வகையில் இந்தத் தொழில்நுட்பம் வடிவமைக்கப்பட்டுள்ளது.