துல்லியமான பொறியியல் மூலம் LLM மாயத்தோற்றங்களைச் சமாளிக்க $9 மில்லியன் நிதியைத் திரட்ட வாய்ப்புள்ளது

📅2 hours ago⏱3 min read

In this article

துல்லியமான பொறியியல் மூலம் LLM மாயத்தோற்றங்களை எதிர்கொள்ள Probably நிறுவனம் $9 மில்லியன் திரட்டுகிறது

பெரிய மொழி மாதிரிகள் (LLMs) தொழில்முறை பணிப்பாய்வுகளில் பெருகிவரும் வகையில் ஒருங்கிணைக்கப்பட்டு வரும் நிலையில், இந்தத் துறை ஒரு தொடர்ச்சியான தடையை எதிர்கொள்கிறது: மிகவும் மேம்பட்ட மாதிரிகள் கூட மாயத்தோற்றங்களை (hallucinate) உருவாக்கும் போக்கு. ஸ்டார்ட்அப் நிறுவனமான Probably, AI நம்பகத்தன்மைக்கான மிகவும் கடுமையான மற்றும் தீர்மானிக்கப்பட்ட (deterministic) அணுகுமுறையை உருவாக்க, Andreessen Horowitz தலைமையிலான $9 மில்லியன் விதை நிதியைப் (seed funding) பெற்று, இந்த சவாலை நேரடியாக எதிர்கொள்கிறது.

99.99% துல்லியத்தை நோக்கி நகர்தல்

நிறுவனர் Peter Elias தலைமையிலான Probably நிறுவனத்தின் முக்கிய நோக்கம், LLM-களின் நிகழ்தகவுத் தன்மைக்கும் (probabilistic nature), தீர்மானிக்கப்பட்ட அமைப்புகளிடமிருந்து (deterministic systems) எதிர்பார்க்கப்படும் 99.99% துல்லியத் தரத்திற்கும் இடையிலான இடைவெளியைக் குறைப்பதாகும். அதிக முக்கியத்துவம் வாய்ந்த சூழல்களில், ஒரு சிறிய உண்மைத் தவறு கூட ஒரு AI கருவியை பயனற்றதாக்கிவிடும். இதைத் தீர்க்க, துல்லியம் என்பது வெறும் மாதிரியின் அளவைப் பொறுத்தது என்ற கருத்திலிருந்து விலகி, "harness engineering" என்பதில் Probably கவனம் செலுத்தி வருகிறது.

இந்த நிறுவனத்தின் முதன்மைத் தயாரிப்பு, சிக்கலான தரவுத் தொகுப்புகளிலிருந்து நுண்ணறிவுகளைப் பெறுவதற்காக வடிவமைக்கப்பட்ட ஒரு தரவு அறிவியல் கருவியாகும். உரையாடல் பதில்களை வழங்கும் சாதாரண சாட்பாட்களைப் போலல்லாமல், Probably-இன் கருவி ஒவ்வொரு பதிலையும் ஒரு குறிப்பிட்ட மேற்கோளுடன் (citation) மற்றும் வெளிப்படையான தணிக்கைப் பாதையுடன் (audit trail) வழங்குகிறது, இது பயனர்கள் ஒவ்வொரு வெளியீட்டிற்குப் பின்னாலுள்ள தர்க்கத்தையும் சரிபார்க்க அனுமதிக்கிறது.

"Data Science Mech Suit" கட்டமைப்பு

ஒரு மிகப்பெரிய மாதிரியின் பகுத்தறியும் திறனை மட்டுமே நம்பியிருக்காமல், Elias "data science mech suit" என்று அழைக்கும் முறையை Probably பயன்படுத்துகிறது. இந்த கட்டமைப்பு ஒரு விரிவான ஹார்னஸ் அமைப்பாக (harness system) செயல்படுகிறது, இதில் LLM-இன் ஆரம்ப வெளியீடு உடனடியாக ஒரு தீர்மானிக்கப்பட்ட சரிபார்ப்பியால் (deterministic validator) ஆய்வு செய்யப்படுகிறது.

LLM ஒரு முடிவை வழங்கும்போது அது அடிப்படை தரவுத் தொகுப்புடன் சரியாகப் பொருந்தவில்லை என்றால், சரிபார்ப்பி அதை நிராகரிக்கிறது. முக்கியமாக, இந்த சரிபார்ப்பிக்கு எதிராகவே LLM சிறப்பாகப் பயிற்சியளிக்கப்படுகிறது, இது வேகம் மற்றும் உண்மைத் தன்மைக்காக மேம்படுத்தப்பட்ட ஒரு மூடிய-சுற்று அமைப்பை (closed-loop system) உருவாக்குகிறது. இந்த அணுகுமுறை ஒரு அடிப்படைத் தத்துவத்தின் அடிப்படையில் செயல்படுகிறது: பொறியியல் மூலம் சூழலைச் செம்மைப்படுத்துவதன் மூலமும், தெளிவற்ற தன்மையைக் குறைப்பதன் மூலமும், மிகப்பெரிய கணக்கீட்டுத் திறன் (computational brute force) இல்லாமலேயே மாதிரியை "சரியானதைச் செய்ய" தூண்ட முடியும்.

சிறிய, உள்ளூர் மாதிரிகள் மூலம் செயல்திறன்

Probably-இன் அணுகுமுறையின் மிக முக்கியமான தொழில்நுட்பத் தாக்கங்களில் ஒன்று, சிறிய மற்றும் அதிக திறன் கொண்ட மாதிரிகளைப் பயன்படுத்தும் හැකියையாகும். "mech suit" சரிபார்ப்பு மற்றும் சூழல் செம்மைப்படுத்துதலின் கடினமான பணிகளைக் கையாளுவதால், இந்த அமைப்பு "frontier மாதிரிகளை விட நான்கு நிலைகள் பலவீனமான" மாதிரிகளிலும் இயங்க முடியும்.

இந்த மாற்றம் மிகப்பெரிய பொருளாதார மற்றும் செயல்பாட்டு நன்மைகளைக் கொண்டுள்ளது:

குறைக்கப்பட்ட டோக்கன் செலவுகள்: சிறிய மாடல்கள் ஒரு வினவலுக்கான (per-query) செலவை கணிசமாகக் குறைக்கின்றன; நிறுவனங்கள் தங்கள் AI பட்ஜெட்களை மேம்படுத்த முயலும்போது இது ஒரு முக்கியமான காரணியாகும்.
உள்ளூர் இயக்கம் (Local Execution): இந்த இலகுவான மாடல்களை, விலையுயர்ந்த மற்றும் அதிக தாமதத்தைக் கொண்ட (high-latency) தரவு மையத் தொடர்புகளுக்குப் பதிலாக, டெஸ்க்டாப் கணினிகள் போன்ற உள்ளூர் வன்பொருள்களில் இயக்க முடியும்.
அளவிடக்கூடிய தன்மை (Scalability): இந்த எஞ்சின், தரவு அறிவியலைத் தாண்டி கணக்கியல் மற்றும் மருத்துவச் சேவைகள் போன்ற துல்லியம் சார்ந்த துறைகளுக்கும் விரிவுபடுத்தும் வகையில் வடிவமைக்கப்பட்டுள்ளது.

பெரிய AI ஆய்வகங்களின் ஊக்க மாதிரிக்கு (Incentive Model) சவால் விடுத்தல்

தற்போதைய AI சூழலில் உள்ள ஒரு கட்டமைப்பு ரீதியான முரண்பாட்டை எலியாஸ் சுட்டிக்காட்டுகிறார்: பெரிய AI ஆய்வகங்கள், அடிக்கடி பயனர்களின் திருத்தங்களைச் சரிபார்க்க வேண்டியிருக்கும் வகையிலான பிரம்மாண்டமான, பொதுப் பயன்பாட்டு மாடல்களை உருவாக்கத் தூண்டப்படுகின்றன. இந்த ஆய்வகங்கள் பெரும்பாலும் டோக்கன் பயன்பாட்டின் அடிப்படையில் கட்டணம் வசூலிப்பதால், அதிக பிழைகளும், அதைத் தொடர்ந்து வரும் கூடுதல் வினவல்களும் உண்மையில் வருவாயை அதிகரிக்கக்கூடும். அளவை (scale) அதிகரிப்பதற்குப் பதிலாக, பொறியியல் மூலம் துல்லியத்தில் கவனம் செலுத்துவதன் மூலமும், "தெளிவற்ற தன்மையைக் குறைப்பதன்" (reducing ambiguity) மூலமும், நம்பகத்தன்மை மட்டுமே முக்கிய அளவுகோலாக இருக்கும் முக்கியமான AI பயன்பாடுகளுக்கான ஒரு தனித்துவமான இடத்தைப் Probably உருவாக்கி வருகிறது.

முக்கியக் கருத்துக்கள்

நிச்சயமான சரிபார்ப்பு (Deterministic Validation): Probably, 99.99% துல்லியத்தை இலக்காகக் கொண்டு, LLM வெளியீடுகளை ஒரு 'deterministic validator'-உடன் ஒப்பிட்டுச் சரிபார்க்க "mech suit" கட்டமைப்பைப் பயன்படுத்துகிறது.
செலவு குறைந்த பொறியியல்: சிறந்த சூழல் பொறியியல் (context engineering) மூலம் தெளிவற்ற தன்மையைக் குறைப்பதன் மூலம், இந்த அமைப்பை உள்ளூர் வன்பொருள்களில் இயங்கக்கூடிய மிகச் சிறிய மற்றும் மலிவான மாடல்களில் இயக்க முடியும்.
துல்லியத்திற்கு முன்னுரிமை: தவறான தகவல்கள் (hallucinations) ஏற்றுக்கொள்ள முடியாத மருத்துவம் மற்றும் நிதி போன்ற அதிக முக்கியத்துவம் வாய்ந்த, துல்லியம் சார்ந்த துறைகளுக்கு AI-ஐக் கொண்டு செல்லும் வகையில் இந்தத் தொழில்நுட்பம் வடிவமைக்கப்பட்டுள்ளது.

துல்லியமான பொறியியல் மூலம் LLM மாயத்தோற்றங்களைச் சமாளிக்க $9 மில்லியன் நிதியைத் திரட்ட வாய்ப்புள்ளது

துல்லியமான பொறியியல் மூலம் LLM மாயத்தோற்றங்களை எதிர்கொள்ள Probably நிறுவனம் $9 மில்லியன் திரட்டுகிறது

99.99% துல்லியத்தை நோக்கி நகர்தல்

"Data Science Mech Suit" கட்டமைப்பு

சிறிய, உள்ளூர் மாதிரிகள் மூலம் செயல்திறன்

பெரிய AI ஆய்வகங்களின் ஊக்க மாதிரிக்கு (Incentive Model) சவால் விடுத்தல்

முக்கியக் கருத்துக்கள்

Continue reading

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

AI ரெட் டீமிங்: எதிரித்தனமான அபாயங்களிலிருந்து பெரிய மொழி மாதிரிகளைப் பாதுகாத்தல்

𝗠𝗔 𝗣𝗿𝗼𝗼𝗳𝗕𝗲𝗻𝗰𝗵: 𝗚𝗣𝗧 𝟱.𝟱 𝗛𝗶𝘁𝘀 𝟭𝟲% 𝗼𝗻 𝗠𝗮𝘁𝗵 𝗔𝗻𝗮𝗹𝘆𝘀𝗶𝘀

𝗧𝗼𝘄𝗮𝗿𝗱𝘀 𝗘𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗟𝗟𝗠 𝗦𝗲𝗿𝘃𝗶𝗻𝗴