Probably Raises $9M to Combat LLM Hallucinations with Precision Engineering

📅2 hours ago⏱3 min read

In this article

LLM Hallucinations સામે લડવા માટે Probably ચોકસાઈપૂર્ણ એન્જિનિયરિંગ સાથે $9M એકત્રિત કરે છે

જેમ જેમ Large Language Models (LLMs) વ્યાવસાયિક કાર્યપ્રવાહોમાં વધુને વધુ એકીકૃત થઈ રહ્યા છે, તેમ ઉદ્યોગ એક સતત અવરોધનો સામનો કરી રહ્યો છે: અત્યંત અદ્યતન મોડલ્સમાં પણ ભ્રમણા (hallucinate) કરવાની વૃત્તિ. સ્ટાર્ટઅપ Probably આ પડકારનો સીધો સામનો કરી રહ્યું છે, અને AI ની વિશ્વસનીયતા માટે વધુ સચોટ અને deterministic અભિગમ બનાવવા માટે Andreessen Horowitz ના નેતૃત્વ હેઠળ $9 મિલિયનનું સીડ ફંડિંગ મેળવ્યું છે.

99.99% ચોકસાઈ તરફ આગળ વધવું

સ્થાપક Peter Elias ના નેતૃત્વ હેઠળ, Probably નું મુખ્ય મિશન LLMs ના probabilistic સ્વભાવ અને deterministic સિસ્ટમ્સ પાસેથી અપેક્ષિત 99.99% ચોકસાઈના ધોરણ વચ્ચેના અંતરને ઘટાડવાનું છે. ઉચ્ચ જોખમ ધરાવતા વાતાવરણમાં, એક સિંગલ તથ્યલક્ષી ભૂલ AI સાધનને નકામું બનાવી શકે છે. આ સમસ્યાના ઉકેલ માટે, Probably એ વિચારથી દૂર જઈ રહ્યું છે કે ચોકસાઈ એ માત્ર મોડલના કદ પર આધારિત છે, અને તેના બદલે "harness engineering" પર ધ્યાન કેન્દ્રિત કરી રહ્યું છે.

કંપનીનું મુખ્ય ઉત્પાદન એક ડેટા સાયન્સ ટૂલ છે જે જટિલ ડેટાસેટ્સમાંથી માહિતી મેળવવા માટે રચાયેલ છે. વાતચીત જેવી પ્રતિક્રિયાઓ આપતા પ્રમાણભૂત ચેટબોટ્સથી વિપરીત, Probably નું ટૂલ દરેક જવાબ સાથે ચોક્કસ સંદર્ભ (citation) અને પારદર્શક ઓડિટ ટ્રેલ પ્રદાન કરે છે, જે વપરાશકર્તાઓને દરેક આઉટપુટ પાછળના તર્કની ચકાસણી કરવાની મંજૂરી આપે છે.

"Data Science Mech Suit" આર્કિટેક્ચર

માત્ર એક વિશાળ મોડલની તર્ક કરવાની ક્ષમતા પર નિર્ભર રહેવાને બદલે, Probably એનો ઉપયોગ કરે છે જેને Elias "data science mech suit" કહે છે. આ આર્કિટેક્ચર એક વિસ્તૃત હાર્નેસ સિસ્ટમ તરીકે કાર્ય કરે છે જ્યાં LLM ના પ્રારંભિક આઉટપુટની તરત જ એક deterministic વેલિડેટર દ્વારા તપાસ કરવામાં આવે છે.

જો LLM એવું પરિણામ આપે છે જે મૂળ ડેટાસેટ સાથે સંપૂર્ણ રીતે સુસંગત નથી, તો વેલિડેટર તેને નકારી દે છે. મહત્વપૂર્ણ રીતે, LLM ને ખાસ કરીને આ વેલિડેટર સામે તાલીમ આપવામાં આવે છે, જે ઝડપ અને તથ્યપૂર્ણ અખંડિતતા માટે ઓપ્ટિમાઇઝ કરેલી ક્લોઝ્ડ-લૂપ સિસ્ટમ બનાવે છે. આ અભિગમ એક મૂળભૂત સિદ્ધાંત પર કામ કરે છે: એન્જિનિયરિંગ દ્વારા સંદર્ભને શુદ્ધ કરીને અને અસ્પષ્ટતા ઘટાડીને, તમે વિશાળ કમ્પ્યુટેશનલ બ્રુટ ફોર્સની જરૂરિયાત વિના મોડલને "સાચું કામ" કરવા માટે મજબૂર કરી શકો છો.

નાના, લોકલ મોડલ્સ દ્વારા કાર્યક્ષમતા

Probably ના અભિગમની સૌથી નોંધપાત્ર ટેકનિકલ અસરોમાં નાના, વધુ કાર્યક્ષમ મોડલ્સનો ઉપયોગ કરવાની ક્ષમતાનો સમાવેશ થાય છે. કારણ કે "mech suit" વેલિડેશન અને સંદર્ભ શુદ્ધિકરણનું મુખ્ય કામ સંભાળે છે, તેથી સિસ્ટમ એવા મોડલ્સ પર કામ કરી શકે છે જે "frontier models કરતા ચાર ક્લાસ નબળા" હોય.

આ ફેરફારના મોટા આર્થિક અને કાર્યકારી ફાયદા છે:

ટોકન ખર્ચમાં ઘટાડો: નાના મોડલ્સ પ્રતિ-ક્વેરી ખર્ચમાં નોંધપાત્ર ઘટાડો કરે છે, જે એન્ટરપ્રાઇઝ માટે તેમના AI બજેટને ઓપ્ટિમાઇઝ કરવા માટે એક મહત્વપૂર્ણ પરિબળ છે.
સ્થાનિક અમલીકરણ (Local Execution): આ હળવા મોડલ્સ મોંઘા અને હાઈ-લેટન્સી ધરાવતા ડેટા સેન્ટર કનેક્શનની જરૂરિયાત વગર, ડેસ્કટોપ કોમ્પ્યુટર જેવા સ્થાનિક હાર્ડવેર પર ચાલી શકે છે.
સ્કેલેબિલિટી (Scalability): આ એન્જિન ડેટા સાયન્સથી આગળ વધીને એકાઉન્ટિંગ અને મેડિકલ સેવાઓ જેવા ચોકસાઈ-સંવેદનશીલ ક્ષેત્રોમાં વિસ્તરણ કરી શકાય તે રીતે ડિઝાઇન કરવામાં આવ્યું છે.

મોટા AI લેબ ઇન્સેન્ટિવ મોડલને પડકાર

એલિયાસ વર્તમાન AI લેન્ડસ્કેપમાં એક માળખાગત અસંતુલન તરફ નિર્દેશ કરે છે: મોટા AI લેબ્સ વિશાળ, સામાન્ય હેતુના મોડલ્સ બનાવવા માટે પ્રોત્સાહિત થાય છે જેને વારંવાર વપરાશકર્તાના સુધારાની જરૂર પડે છે. આ લેબ્સ ઘણીવાર ટોકન વપરાશના આધારે ચાર્જ લેતી હોવાથી, વધુ ભૂલો અને વધુ ફોલો-અપ ક્વેરીઝ વાસ્તવમાં આવક વધારી શકે છે. સ્કેલને બદલે એન્જિનિયરિંગ દ્વારા ચોકસાઈ અને "અસ્પષ્ટતા ઘટાડવા" પર ધ્યાન કેન્દ્રિત કરીને, Probably મિશન-ક્રિટિકલ AI એપ્લિકેશન્સ માટે એક અલગ સ્થાન બનાવી રહ્યું છે જ્યાં વિશ્વસનીયતા એ જ એકમાત્ર મહત્વનું માપદંડ છે.

મુખ્ય મુદ્દાઓ

ડિટરમિનિસ્ટિક વેલિડેશન (Deterministic Validation): Probably 99.99% ચોકસાઈના લક્ષ્ય સાથે, LLM આઉટપુટને ડિટરમિનિસ્ટિક વેલિડેટર સામે તપાસવા માટે "mech suit" આર્કિટેક્ચરનો ઉપયોગ કરે છે.
ખર્ચ-અસરકારક એન્જિનિયરિંગ: બહેતર કોન્ટેક્સ્ટ એન્જિનિયરિંગ દ્વારા અસ્પષ્ટતા ઘટાડીને, આ સિસ્ટમ ઘણા નાના અને સસ્તા મોડલ્સ પર ચાલી શકે છે જે સ્થાનિક હાર્ડવેર પર કાર્ય કરી શકે છે.
ચોકસાઈ-પ્રથમ ફોકસ: આ ટેકનોલોજી AI ને મેડિસિન અને ફાઇનાન્સ જેવા ઉચ્ચ જોખમ ધરાવતા અને ચોકસાઈ-સંવેદનશીલ ઉદ્યોગોમાં લઈ જવા માટે ડિઝાઇન કરવામાં આવી છે જ્યાં હેલ્યુસિનેશન (hallucinations) અસ્વીકાર્ય છે.

Probably Raises $9M to Combat LLM Hallucinations with Precision Engineering

LLM Hallucinations સામે લડવા માટે Probably ચોકસાઈપૂર્ણ એન્જિનિયરિંગ સાથે $9M એકત્રિત કરે છે

99.99% ચોકસાઈ તરફ આગળ વધવું

"Data Science Mech Suit" આર્કિટેક્ચર

નાના, લોકલ મોડલ્સ દ્વારા કાર્યક્ષમતા

મોટા AI લેબ ઇન્સેન્ટિવ મોડલને પડકાર

મુખ્ય મુદ્દાઓ

Continue reading

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

AI રેડ ટીમિંગ: પ્રતિકૂળ જોખમો સામે લાર્જ લેંગ્વેજ મોડલ્સને સુરક્ષિત કરવા

𝗠𝗔 𝗣𝗿𝗼𝗼𝗳𝗕𝗲𝗻𝗰𝗵: 𝗚𝗣𝗧 𝟱.𝟱 𝗛𝗶𝘁𝘀 𝟭𝟲% 𝗼𝗻 𝗠𝗮𝘁𝗵 𝗔𝗻𝗮𝗹𝘆𝘀𝗶𝘀

કાર્યક્ષમ LLM સર્વિંગ તરફ