LLM Hallucinations સામે લડવા માટે Probably ચોકસાઈપૂર્ણ એન્જિનિયરિંગ સાથે $9M એકત્રિત કરે છે
જેમ જેમ Large Language Models (LLMs) વ્યાવસાયિક કાર્યપ્રવાહોમાં વધુને વધુ એકીકૃત થઈ રહ્યા છે, તેમ ઉદ્યોગ એક સતત અવરોધનો સામનો કરી રહ્યો છે: અત્યંત અદ્યતન મોડલ્સમાં પણ ભ્રમણા (hallucinate) કરવાની વૃત્તિ. સ્ટાર્ટઅપ Probably આ પડકારનો સીધો સામનો કરી રહ્યું છે, અને AI ની વિશ્વસનીયતા માટે વધુ સચોટ અને deterministic અભિગમ બનાવવા માટે Andreessen Horowitz ના નેતૃત્વ હેઠળ $9 મિલિયનનું સીડ ફંડિંગ મેળવ્યું છે.
99.99% ચોકસાઈ તરફ આગળ વધવું
સ્થાપક Peter Elias ના નેતૃત્વ હેઠળ, Probably નું મુખ્ય મિશન LLMs ના probabilistic સ્વભાવ અને deterministic સિસ્ટમ્સ પાસેથી અપેક્ષિત 99.99% ચોકસાઈના ધોરણ વચ્ચેના અંતરને ઘટાડવાનું છે. ઉચ્ચ જોખમ ધરાવતા વાતાવરણમાં, એક સિંગલ તથ્યલક્ષી ભૂલ AI સાધનને નકામું બનાવી શકે છે. આ સમસ્યાના ઉકેલ માટે, Probably એ વિચારથી દૂર જઈ રહ્યું છે કે ચોકસાઈ એ માત્ર મોડલના કદ પર આધારિત છે, અને તેના બદલે "harness engineering" પર ધ્યાન કેન્દ્રિત કરી રહ્યું છે.
કંપનીનું મુખ્ય ઉત્પાદન એક ડેટા સાયન્સ ટૂલ છે જે જટિલ ડેટાસેટ્સમાંથી માહિતી મેળવવા માટે રચાયેલ છે. વાતચીત જેવી પ્રતિક્રિયાઓ આપતા પ્રમાણભૂત ચેટબોટ્સથી વિપરીત, Probably નું ટૂલ દરેક જવાબ સાથે ચોક્કસ સંદર્ભ (citation) અને પારદર્શક ઓડિટ ટ્રેલ પ્રદાન કરે છે, જે વપરાશકર્તાઓને દરેક આઉટપુટ પાછળના તર્કની ચકાસણી કરવાની મંજૂરી આપે છે.
"Data Science Mech Suit" આર્કિટેક્ચર
માત્ર એક વિશાળ મોડલની તર્ક કરવાની ક્ષમતા પર નિર્ભર રહેવાને બદલે, Probably એનો ઉપયોગ કરે છે જેને Elias "data science mech suit" કહે છે. આ આર્કિટેક્ચર એક વિસ્તૃત હાર્નેસ સિસ્ટમ તરીકે કાર્ય કરે છે જ્યાં LLM ના પ્રારંભિક આઉટપુટની તરત જ એક deterministic વેલિડેટર દ્વારા તપાસ કરવામાં આવે છે.
જો LLM એવું પરિણામ આપે છે જે મૂળ ડેટાસેટ સાથે સંપૂર્ણ રીતે સુસંગત નથી, તો વેલિડેટર તેને નકારી દે છે. મહત્વપૂર્ણ રીતે, LLM ને ખાસ કરીને આ વેલિડેટર સામે તાલીમ આપવામાં આવે છે, જે ઝડપ અને તથ્યપૂર્ણ અખંડિતતા માટે ઓપ્ટિમાઇઝ કરેલી ક્લોઝ્ડ-લૂપ સિસ્ટમ બનાવે છે. આ અભિગમ એક મૂળભૂત સિદ્ધાંત પર કામ કરે છે: એન્જિનિયરિંગ દ્વારા સંદર્ભને શુદ્ધ કરીને અને અસ્પષ્ટતા ઘટાડીને, તમે વિશાળ કમ્પ્યુટેશનલ બ્રુટ ફોર્સની જરૂરિયાત વિના મોડલને "સાચું કામ" કરવા માટે મજબૂર કરી શકો છો.
નાના, લોકલ મોડલ્સ દ્વારા કાર્યક્ષમતા
Probably ના અભિગમની સૌથી નોંધપાત્ર ટેકનિકલ અસરોમાં નાના, વધુ કાર્યક્ષમ મોડલ્સનો ઉપયોગ કરવાની ક્ષમતાનો સમાવેશ થાય છે. કારણ કે "mech suit" વેલિડેશન અને સંદર્ભ શુદ્ધિકરણનું મુખ્ય કામ સંભાળે છે, તેથી સિસ્ટમ એવા મોડલ્સ પર કામ કરી શકે છે જે "frontier models કરતા ચાર ક્લાસ નબળા" હોય.
આ ફેરફારના મોટા આર્થિક અને કાર્યકારી ફાયદા છે:
- ટોકન ખર્ચમાં ઘટાડો: નાના મોડલ્સ પ્રતિ-ક્વેરી ખર્ચમાં નોંધપાત્ર ઘટાડો કરે છે, જે એન્ટરપ્રાઇઝ માટે તેમના AI બજેટને ઓપ્ટિમાઇઝ કરવા માટે એક મહત્વપૂર્ણ પરિબળ છે.
- સ્થાનિક અમલીકરણ (Local Execution): આ હળવા મોડલ્સ મોંઘા અને હાઈ-લેટન્સી ધરાવતા ડેટા સેન્ટર કનેક્શનની જરૂરિયાત વગર, ડેસ્કટોપ કોમ્પ્યુટર જેવા સ્થાનિક હાર્ડવેર પર ચાલી શકે છે.
- સ્કેલેબિલિટી (Scalability): આ એન્જિન ડેટા સાયન્સથી આગળ વધીને એકાઉન્ટિંગ અને મેડિકલ સેવાઓ જેવા ચોકસાઈ-સંવેદનશીલ ક્ષેત્રોમાં વિસ્તરણ કરી શકાય તે રીતે ડિઝાઇન કરવામાં આવ્યું છે.
મોટા AI લેબ ઇન્સેન્ટિવ મોડલને પડકાર
એલિયાસ વર્તમાન AI લેન્ડસ્કેપમાં એક માળખાગત અસંતુલન તરફ નિર્દેશ કરે છે: મોટા AI લેબ્સ વિશાળ, સામાન્ય હેતુના મોડલ્સ બનાવવા માટે પ્રોત્સાહિત થાય છે જેને વારંવાર વપરાશકર્તાના સુધારાની જરૂર પડે છે. આ લેબ્સ ઘણીવાર ટોકન વપરાશના આધારે ચાર્જ લેતી હોવાથી, વધુ ભૂલો અને વધુ ફોલો-અપ ક્વેરીઝ વાસ્તવમાં આવક વધારી શકે છે. સ્કેલને બદલે એન્જિનિયરિંગ દ્વારા ચોકસાઈ અને "અસ્પષ્ટતા ઘટાડવા" પર ધ્યાન કેન્દ્રિત કરીને, Probably મિશન-ક્રિટિકલ AI એપ્લિકેશન્સ માટે એક અલગ સ્થાન બનાવી રહ્યું છે જ્યાં વિશ્વસનીયતા એ જ એકમાત્ર મહત્વનું માપદંડ છે.
મુખ્ય મુદ્દાઓ
- ડિટરમિનિસ્ટિક વેલિડેશન (Deterministic Validation): Probably 99.99% ચોકસાઈના લક્ષ્ય સાથે, LLM આઉટપુટને ડિટરમિનિસ્ટિક વેલિડેટર સામે તપાસવા માટે "mech suit" આર્કિટેક્ચરનો ઉપયોગ કરે છે.
- ખર્ચ-અસરકારક એન્જિનિયરિંગ: બહેતર કોન્ટેક્સ્ટ એન્જિનિયરિંગ દ્વારા અસ્પષ્ટતા ઘટાડીને, આ સિસ્ટમ ઘણા નાના અને સસ્તા મોડલ્સ પર ચાલી શકે છે જે સ્થાનિક હાર્ડવેર પર કાર્ય કરી શકે છે.
- ચોકસાઈ-પ્રથમ ફોકસ: આ ટેકનોલોજી AI ને મેડિસિન અને ફાઇનાન્સ જેવા ઉચ્ચ જોખમ ધરાવતા અને ચોકસાઈ-સંવેદનશીલ ઉદ્યોગોમાં લઈ જવા માટે ડિઝાઇન કરવામાં આવી છે જ્યાં હેલ્યુસિનેશન (hallucinations) અસ્વીકાર્ય છે.