துல்லியமான பொறியியல் மூலம் LLM மாயத்தோற்றங்களை எதிர்கொள்ள Probably நிறுவனம் $9 மில்லியன் திரட்டுகிறது

பெரிய மொழி மாதிரிகள் (LLMs) தொழில்முறை பணிப்பாய்வுகளில் பெருகிவரும் வகையில் ஒருங்கிணைக்கப்பட்டு வரும் நிலையில், இந்தத் துறை ஒரு தொடர்ச்சியான தடையை எதிர்கொள்கிறது: மிகவும் மேம்பட்ட மாதிரிகள் கூட மாயத்தோற்றங்களை (hallucinate) உருவாக்கும் போக்கு. ஸ்டார்ட்அப் நிறுவனமான Probably, AI நம்பகத்தன்மைக்கான மிகவும் கடுமையான மற்றும் தீர்மானிக்கப்பட்ட (deterministic) அணுகுமுறையை உருவாக்க, Andreessen Horowitz தலைமையிலான $9 மில்லியன் விதை நிதியைப் (seed funding) பெற்று, இந்த சவாலை நேரடியாக எதிர்கொள்கிறது.

99.99% துல்லியத்தை நோக்கி நகர்தல்

நிறுவனர் Peter Elias தலைமையிலான Probably நிறுவனத்தின் முக்கிய நோக்கம், LLM-களின் நிகழ்தகவுத் தன்மைக்கும் (probabilistic nature), தீர்மானிக்கப்பட்ட அமைப்புகளிடமிருந்து (deterministic systems) எதிர்பார்க்கப்படும் 99.99% துல்லியத் தரத்திற்கும் இடையிலான இடைவெளியைக் குறைப்பதாகும். அதிக முக்கியத்துவம் வாய்ந்த சூழல்களில், ஒரு சிறிய உண்மைத் தவறு கூட ஒரு AI கருவியை பயனற்றதாக்கிவிடும். இதைத் தீர்க்க, துல்லியம் என்பது வெறும் மாதிரியின் அளவைப் பொறுத்தது என்ற கருத்திலிருந்து விலகி, "harness engineering" என்பதில் Probably கவனம் செலுத்தி வருகிறது.

இந்த நிறுவனத்தின் முதன்மைத் தயாரிப்பு, சிக்கலான தரவுத் தொகுப்புகளிலிருந்து நுண்ணறிவுகளைப் பெறுவதற்காக வடிவமைக்கப்பட்ட ஒரு தரவு அறிவியல் கருவியாகும். உரையாடல் பதில்களை வழங்கும் சாதாரண சாட்பாட்களைப் போலல்லாமல், Probably-இன் கருவி ஒவ்வொரு பதிலையும் ஒரு குறிப்பிட்ட மேற்கோளுடன் (citation) மற்றும் வெளிப்படையான தணிக்கைப் பாதையுடன் (audit trail) வழங்குகிறது, இது பயனர்கள் ஒவ்வொரு வெளியீட்டிற்குப் பின்னாலுள்ள தர்க்கத்தையும் சரிபார்க்க அனுமதிக்கிறது.

"Data Science Mech Suit" கட்டமைப்பு

ஒரு மிகப்பெரிய மாதிரியின் பகுத்தறியும் திறனை மட்டுமே நம்பியிருக்காமல், Elias "data science mech suit" என்று அழைக்கும் முறையை Probably பயன்படுத்துகிறது. இந்த கட்டமைப்பு ஒரு விரிவான ஹார்னஸ் அமைப்பாக (harness system) செயல்படுகிறது, இதில் LLM-இன் ஆரம்ப வெளியீடு உடனடியாக ஒரு தீர்மானிக்கப்பட்ட சரிபார்ப்பியால் (deterministic validator) ஆய்வு செய்யப்படுகிறது.

LLM ஒரு முடிவை வழங்கும்போது அது அடிப்படை தரவுத் தொகுப்புடன் சரியாகப் பொருந்தவில்லை என்றால், சரிபார்ப்பி அதை நிராகரிக்கிறது. முக்கியமாக, இந்த சரிபார்ப்பிக்கு எதிராகவே LLM சிறப்பாகப் பயிற்சியளிக்கப்படுகிறது, இது வேகம் மற்றும் உண்மைத் தன்மைக்காக மேம்படுத்தப்பட்ட ஒரு மூடிய-சுற்று அமைப்பை (closed-loop system) உருவாக்குகிறது. இந்த அணுகுமுறை ஒரு அடிப்படைத் தத்துவத்தின் அடிப்படையில் செயல்படுகிறது: பொறியியல் மூலம் சூழலைச் செம்மைப்படுத்துவதன் மூலமும், தெளிவற்ற தன்மையைக் குறைப்பதன் மூலமும், மிகப்பெரிய கணக்கீட்டுத் திறன் (computational brute force) இல்லாமலேயே மாதிரியை "சரியானதைச் செய்ய" தூண்ட முடியும்.

சிறிய, உள்ளூர் மாதிரிகள் மூலம் செயல்திறன்

Probably-இன் அணுகுமுறையின் மிக முக்கியமான தொழில்நுட்பத் தாக்கங்களில் ஒன்று, சிறிய மற்றும் அதிக திறன் கொண்ட மாதிரிகளைப் பயன்படுத்தும் හැකියையாகும். "mech suit" சரிபார்ப்பு மற்றும் சூழல் செம்மைப்படுத்துதலின் கடினமான பணிகளைக் கையாளுவதால், இந்த அமைப்பு "frontier மாதிரிகளை விட நான்கு நிலைகள் பலவீனமான" மாதிரிகளிலும் இயங்க முடியும்.

இந்த மாற்றம் மிகப்பெரிய பொருளாதார மற்றும் செயல்பாட்டு நன்மைகளைக் கொண்டுள்ளது:

பெரிய AI ஆய்வகங்களின் ஊக்க மாதிரிக்கு (Incentive Model) சவால் விடுத்தல்

தற்போதைய AI சூழலில் உள்ள ஒரு கட்டமைப்பு ரீதியான முரண்பாட்டை எலியாஸ் சுட்டிக்காட்டுகிறார்: பெரிய AI ஆய்வகங்கள், அடிக்கடி பயனர்களின் திருத்தங்களைச் சரிபார்க்க வேண்டியிருக்கும் வகையிலான பிரம்மாண்டமான, பொதுப் பயன்பாட்டு மாடல்களை உருவாக்கத் தூண்டப்படுகின்றன. இந்த ஆய்வகங்கள் பெரும்பாலும் டோக்கன் பயன்பாட்டின் அடிப்படையில் கட்டணம் வசூலிப்பதால், அதிக பிழைகளும், அதைத் தொடர்ந்து வரும் கூடுதல் வினவல்களும் உண்மையில் வருவாயை அதிகரிக்கக்கூடும். அளவை (scale) அதிகரிப்பதற்குப் பதிலாக, பொறியியல் மூலம் துல்லியத்தில் கவனம் செலுத்துவதன் மூலமும், "தெளிவற்ற தன்மையைக் குறைப்பதன்" (reducing ambiguity) மூலமும், நம்பகத்தன்மை மட்டுமே முக்கிய அளவுகோலாக இருக்கும் முக்கியமான AI பயன்பாடுகளுக்கான ஒரு தனித்துவமான இடத்தைப் Probably உருவாக்கி வருகிறது.

முக்கியக் கருத்துக்கள்