Von Docusaurus zu WordPress: Drei Wege, einen KI-Chat zu bauen
Ich habe drei verschiedene KI-Chat-Architekturen entwickelt. Jede von ihnen löst ein anderes Problem.
Das Ziel ist nicht, die beste Technologie zu finden. Das Ziel ist es, die Technologie auf Ihre Zielgruppe abzustimmen.
1. Der statische Index (Docusaurus + Vercel) Dieser Ansatz verwendet eine JSON-Datei innerhalb einer statischen Website. Ein Build-Schritt wandelt Ihre Markdown-Dateien in einen einzigen Index um. Die Suche läuft im Arbeitsspeicher mithilfe einer Serverless-Funktion.
• Bestens geeignet für: Dokumentationsseiten, die Sie selbst betreiben. • Vorteile: Keine zusätzliche Infrastruktur erforderlich. Es ist schnell und kostengünstig. • Nachteile: Es ist nicht skalierbar. Es funktioniert nur bei geringen Textmengen.
2. Der skalierbare Service (Neon + pgvector) Dies nutzt eine Postgres-Datenbank mit Vektor-Unterstützung. Es verwendet echte semantische Suche, um Daten schnell zu finden.
• Bestens geeignet für: SaaS-Produkte mit vielen Nutzern. • Vorteile: Es bewältigt massive Datenmengen. Es unterstützt Multi-User-Konten und den Verlauf. • Nachteile: Es erfordert eine verwaltete Infrastruktur und mehr betrieblichen Aufwand.
3. Das Drop-in-Plugin (WordPress) Diese Version speichert die Vektoren direkt in der WordPress-Datenbank. Sie nutzt PHP, um eine Brute-Force-Suche über die Textabschnitte durchzuführen.
• Bestens geeignet für: Kunden, die ein einfaches WordPress-Plugin wünschen. • Vorteile: Keine zusätzliche Einrichtung. Es funktioniert auf jedem WordPress-Host. Es bleibt innerhalb der Website-Datenbank. • Nachteile: Es ist bei sehr großen Datensätzen langsamer.
Wichtigste Erkenntnisse:
- Passen Sie die Architektur an das Deployment an. Ein WordPress-Plugin, das eine separate Datenbank erfordert, ist kein nützliches Plugin.
- Fangen Sie klein an. Ein statischer JSON-Index beweist, dass Ihr Nutzererlebnis funktioniert, bevor Sie komplexe Datenbanken aufbauen.
- Brute-Force-Suche ist für kleine Seiten völlig in Ordnung. Für ein paar tausend Textpassagen ist sie schnell genug. Nutzen Sie komplexe Vektor-Engines erst, wenn es unbedingt nötig ist.
- Halten Sie Ihren Code flexibel. Verwenden Sie ein Interface für Ihren Vektor-Speicher. Dies ermöglicht es Ihnen, von JSON zu Postgres zu wechseln, ohne Ihre Anwendung neu schreiben zu müssen.
- Sicherheit ist wichtig. Verschlüsseln Sie API-Schlüssel auf jeder Ebene. Nutzen Sie ein Bring-Your-Own-Key-Modell, damit Sie keine sensiblen Nutzerdaten verarbeiten müssen.
Quelle: https://dev.to/kaidanov/from-docusaurus-mai-to-a-wordpress-ai-chat-with-vectors-41ba