𝗛𝗼𝗲 𝗥𝗔𝗚 𝗔𝗜-𝗵𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗲𝘀 𝗺𝗲𝘁 𝟴𝟱% 𝘃𝗲𝗿𝗺𝗶𝗻𝗱𝗲𝗿𝘁
AI verzint vaak dingen. Dit wordt hallucinatie genoemd.
Retrieval Augmented Generation (RAG) lost dit probleem op. Het voorkomt dat de AI gaat gokken en dwingt het om naar echte feiten te kijken.
Data van Pinecone laat een enorm verschil zien. Wanneer GPT-4 vragen stelt over feiten van na 2021, daalde het hallucinatiepercentage van 27% naar slechts 4% met behulp van RAG.
Hoe werkt het?
Zie een AI zonder RAG als een student die een toets maakt uit het hoofd. Als ze een feit vergeten, kunnen ze gaan liegen om slim te lijken.
Zie een AI met RAG als een student die een open boek-toets maakt. Ze zoeken het antwoord op in een tekstboek voordat ze antwoorden.
Het proces volgt deze stappen:
• Het systeem zet je vraag om in een wiskundige code die een vector wordt genoemd. • Het doorzoekt een database naar tekstfragmenten met vergelijkbare wiskundige codes. • Het selecteert de beste overeenkomsten op basis van gelijkenisscores. • Het voegt deze specifieke informatie toe aan je prompt. • De AI leest de verstrekte feiten om het antwoord te schrijven. • Het systeem toont je de bronnen, zodat je ze kunt controleren.
Waarom dit belangrijk is voor je werk:
- Nauwkeurigheid: De AI gebruikt echte data in plaats van het getrainde geheugen.
- Actualiteit: Je kunt de AI het nieuws van vandaag geven zonder het hele model opnieuw te trainen.
- Transparantie: Je ziet precies waar de informatie vandaan komt.
- Lage kosten: Het verwerken van een klein stukje data via RAG kost $0,002. Het verwerken van een enorm contextvenster kan $2,00 kosten.
Grote namen gebruiken dit al:
- Perplexity AI: Gebruikt RAG om te fungeren als een zoekmachine met citaten.
- Claude: Gebruikt RAG om kosten te besparen op lange documenten.
- Microsoft Copilot: Gebruikt RAG om je bestanden en e-mails te lezen.
RAG verandert AI van een creatieve verhalenverteller in een betrouwbare onderzoeker.
Bron: https://dev.to/tawan_shamsanor_30e1980a9/rag-ldkaarhlnkhng-ai-aid-85-aidyaangair-57ni