𝗪𝗵𝘆 𝗧𝘄𝗶𝗼 𝗖𝗵𝗼𝘀𝗲 𝗩𝗲𝗿𝘁𝗲𝘅 𝗔𝗜 𝗦𝗲𝗮𝗿𝗰𝗵 𝗼𝘃𝗲𝗿 𝗽𝗴𝘃𝗲𝗰𝘁𝗼𝗿

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialsaa 13 zilizopita2min read

𝗪𝗵𝘆 𝗧𝘄𝗶𝗼 𝗜𝗹𝗶𝗰𝗵𝗼𝗸𝗮 𝗩𝗲𝗿𝘁𝗲𝘅 𝗔𝗜 𝗦𝗲𝗮𝗿𝗰𝗵 𝗕𝗮𝗱𝗮𝗹𝗮 𝗽𝗴𝘃𝗲𝗰𝘁𝗼𝗿

Tulijenga mfumo wetu wa kwanza wa RAG hapa Twio tukitumia pgvector. Ilikuwa chaguo la haraka. Data zetu zilikuwa kwenye PostgreSQL. Kuongeza embeddings huko kulikuwa rahisi.

Tulipokuwa tukikua, tatizo letu lilibadilika. Hatukuuliza tena jinsi ya kuhifadhi vectors. Tuliuliza jinsi ya kuelewa maelfu ya nyaraka za mawakala (brokers) zilizochanganyikiwa, barua pepe, na viambatisho.

Twio inahudumia mawakala wa mikopo. Kesi moja inajumuisha: • Mitambo ya barua pepe • Stakabadhi za malipo na taarifa za benki • Fomu za mkopo na sheria za mkopeshi • Kumbukumbu zilizoandikwa kwa mkono

AI lazima ijibu maswali kama: • Ni barua pepe ipi iliyotaja hitaji lililokosekana? • Je, taarifa hii ya benki inathibitisha kipato? • Fupisha nyaraka zote kwa mkopaji huyu.

Ikiwa upatikanaji (retrieval) ni dhaifu, jibu litakuwa dhaifu. Ikiwa uchambuzi (parsing) ni mbaya, modeli itaona ushahidi usio sahihi. RAG ndiyo kumbukumbu ya bidhaa yetu.

pgvector ilifanya kazi vizuri kwa toleo letu la kwanza kwa sababu: • Haikuhitaji miundombinu mipya. • Ilikuwa na gharama nafuu. • Iliruhusu kurekebisha makosa (debugging) ya SQL kwa urahisi. • Ilikuwa rahisi kuituma haraka.

Lakini pgvector ni sehemu tu ya mtiririko (pipeline) wa RAG. Ilituachia kazi nyingine: • Kupakua viambatisho. • Kuchukua maandishi kutoka kwenye PDF na nakala (scans) kupitia OCR. • Kugawanya nyaraka katika vipande (chunking) na kutengeneza embeddings. • Kubuni metadata na maswali ya upatikanaji (retrieval queries). • Kurekebisha (tuning) viashiria (indexes) na mpangilio (ranking). • Kufuatilia mzigo wa hifadhidata (database load).

PDF safi ni rahisi. Taarifa ya benki iliyoskaniwa ni ngumu. Barua pepe yenye viambatisho vitano na majedwali ni ngumu zaidi. Kwa kutumia pgvector, ilibidi tuboreshe kila udhaifu katika mtiririko huo.

Gharama ilihamia kutoka kwenye bili yetu ya wingu (cloud bill) kwenda kwenye muda wetu wa uhandisi. Muda wa uhandisi ulikuwa rasilimali yetu yenye upungufu mkubwa zaidi.

Ulinganifu: • Nyaraka zilizoskaniwa: Tunajenga OCR kwa kutumia pgvector. Vertex inashughulikia sehemu kubwa ya usindikaji wa nyaraka. • Maswali ya nyaraka: Tunaunda maswali na mpangilio kwa kutumia pgvector. Vertex inatoa utafutaji unaosimamiwa (managed search). • Ongezeko la viambatisho: Postgres inabeba mzigo kwa kutumia pgvector. Vertex inaweka mzigo nje ya hifadhidata yetu kuu. • Gharama: pgvector ina gharama ndogo za huduma. Vertex ina gharama ndogo za uhandisi na matengenezo.

pgvector ni rahisi zaidi kama nyongeza ya hifadhidata (database extension). Vertex ni rahisi zaidi kama uamuzi wa bidhaa.

Vertex inatusaidia kwa njia nne: • Miundombinu kidogo zaidi ya kusimamia. • Mantiki kidogo zaidi ya usindikaji wa nyaraka ya kudumisha. • Postgres inabaki ikiwa imejikita kwenye miamala ya biashara. • Inapanuka (scales) kadiri kiasi cha nyaraka zetu kinavyoongezeka.

Vertex si bure. Lakini kujenga OCR, indexing, na ranking yetu wenyewe pia kuna gharama. Tunalipa gharama hiyo kwa wiki za wahandisi.

Tumia pgvector ikiwa: • Kiasi chako cha data ni cha wastani. • Nyaraka zako tayari ni maandishi safi. • Unahitaji uchujaji mkali wa SQL. • Unataka toleo la kwanza la haraka na la gharama nafuu.

Somo letu ni rahisi: Anza na zana inayokusaidia kujifunza haraka zaidi. Hamia kwenye zana inayokusaidia kufanya kazi vizuri zaidi.

Chanzo: https://dev.to/twio_ai/why-twio-chose-vertex-ai-search-over-pgvector-for-production-rag-51jm

Jumuiya ya kujifunza ya hiari: https://t.me/GyaanSetuAi

𝗪𝗵𝘆 𝗧𝘄𝗶𝗼 𝗖𝗵𝗼𝘀𝗲 𝗩𝗲𝗿𝘁𝗲𝘅 𝗔𝗜 𝗦𝗲𝗮𝗿𝗰𝗵 𝗼𝘃𝗲𝗿 𝗽𝗴𝘃𝗲𝗰𝘁𝗼𝗿

Continue reading

Vector Tables 101: Kuelewa Vector na PGVector

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗕𝗲𝘁𝘁𝗲𝗿 𝗔𝗜 𝘄𝗶𝘁𝗵 𝗥𝗔𝗚

𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

𝗖𝗵𝗼𝗼𝘀𝗶𝗻𝗴 𝗮 𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗮𝘁𝗮𝗯𝗮𝘀𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲

𝗪𝗵𝗮𝘁 𝗜𝘀 𝗮 𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗮𝘁𝗮𝗯𝗮𝘀𝗲?