I Built RAG From Scratch in Python to Understand It

Translated for your language. Read the original.

AI-assisted draft.

I Built RAG From Scratch in Python to Understand It

בניתי RAG מאפס ב-Python כדי להבין אותו

השתמשתי ב-LangChain בסביבת ייצור במשך שישה חודשים. לא יכולתי להסביר איך הוא עבד. לא ידעתי למה בחרתי במדדים מסוימים או איך טקסט הופך לווקטורים. הספרייה הסתירה את הלוגיקה.

כדי לתקן זאת, מחקתי את ה-framework. כתבתי pipeline של RAG מאפס באמצעות 500 שורות של Python נקי.

הנה מה שלמדתי מבניית ה-stack באופן ידני.

The Problem with Black Boxes כשמשתמשים בספריות ברמה גבוהה (high-level), מאבדים שליטה. ראיתי מודלים שמזייפים עובדות (hallucinate) או נותנים ציטוטים שגויים. לא יכולתי לדעת אם השגיאה הייתה ב-chunker, במודל ה-embedding או ב-prompt.

כשבונים את זה בעצמכם, ניתן לבחון כל שכבה. אפשר להדפיס את ה-chunks המדויקים שנשלחו ל-LLM. אפשר לראות בדיוק איפה משפט נקטע.

The Five Layers of RAG RAG הוא לא אלגוריתם אחד. אלו חמישה תהליכים שונים המצטברים יחד:

Chunking: החלטה כיצד לפצל טקסט.
Embedding: הפיכת טקסט למתמטיקה.
Retrieval: מציאת החלקים הנכונים.
Prompt Construction: הנחיית המודל כיצד להתנהג.
Generation: קבלת התשובה הסופית.

Lessons from the Build

Chunking הוא השלב החשוב ביותר רוב המדריכים מדלגים על זה. אם לא משתמשים ב-overlap, מאבדים את ההקשר בגבולות. השתמשתי ב-sliding window עם overlap ברמת התווים. זה מבטיח שהמודל יראה את הקשר בין שני chunks.
למדדי מרחק (distance metrics) יש חשיבות ביליתי שעות ב-debugging של תוצאות חיפוש גרועות. הבעיה לא הייתה בנתונים. היא הייתה במדד. ב-ChromaDB ברירת המחדל היא מרחק L2. לחיפוש סמנטי, צריך Cosine similarity. שורת קוד אחת שינתה הכל.
Prompts זקוקים למגבלות LLM הוא כלי להשלמת טקסט, לא אורקל. אם שואלים שאלה מעורפלת, הוא ימציא תשובה. למדתי להשתמש ב-refusal template קשיח. אמרתי למודל: "אם ההקשר (context) אינו מכיל את התשובה, אמור שאינך יודע". זה הפחית את ה-hallucinations מ-40% ל-5%.
בצעו שליחות ב-batches שליחת בקשת HTTP אחת לכל chunk היא איטית. שליחה ב-batches מהירה הרבה יותר. זה מאפשר למודל המקומי לבצע pipeline לעבודה.
בצעו בדיקות מלמטה למעלה אל תכתבו בדיקות בסוף. בדקו קודם את ה-chunker שלכם. אחר כך את ה-embedder. ואז את ה-store. אם תבדקו רק בסוף, תבדקו את הבאגים במקום את הלוגיקה.

אם אתם מרגישים שאתם לא באמת מבינים את ה-AI stack שלכם, תבנו אותו בעצמכם. הקוד הוא לא המטרה. החשיבה היא המטרה.

Source: https://dev.to/avinash_zala_1c6f5e7c4af9/i-built-rag-from-scratch-in-python-to-understand-it-heres-what-i-learned-33kf

Optional learning community: https://t.me/GyaanSetuAi

I Built RAG From Scratch in Python to Understand It

Continue reading

𝗙𝗿𝗼𝗺 𝗜 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗼𝗼𝗱 𝗡𝗼𝘁𝗵𝗶𝗻𝗴 𝘁𝗼 𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗥𝗔𝗚 𝗔𝗽𝗽

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗥𝗔𝗚 𝗣𝗶𝗽𝗲𝗹𝗶𝗻𝗲 𝗙𝗿𝗼𝗺 𝗦𝗰𝗿𝗮𝘁𝗰𝗵

בניית RAG מאפס

בניתי בוט שאלות ותשובות לקוד באמצעות RAG: מה עבד ומה נכשל

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀