Entwicklung eines serverlosen Web-Suchdienstes für KI-Agenten
KI-Agenten benötigen die Websuche, um aktuelle Fakten zu finden.
Wenn viele Teams Agenten entwickeln, nutzen sie oft unterschiedliche Suchanbieter. Das führt zu Chaos. Man landet bei verschiedenen APIs, unterschiedlichen Kosten und fragmentierten Tools.
Bei PostNL haben wir dieses Problem gelöst, indem wir einen zentralisierten Suchdienst auf AWS aufgebaut haben.
Wir haben ein System entwickelt, das wie folgt funktioniert:
• Eine einzige Schnittstelle für alle Teams. • Unterstützung für viele Such-Backends. • Geringer operativer Aufwand. • Niedrige Kosten. • Die Möglichkeit, Anbieter zu wechseln, ohne etwas zu beschädigen.
Unsere Architektur nutzt einen Routing-Layer. Dieser Layer sitzt zwischen Ihrer KI-Anwendung und dem Suchanbieter.
Die Kernkomponenten des Systems:
- API Gateway: Bietet einen privaten Einstiegspunkt für autorisierte Benutzer.
- AWS Lambda: Führt einen leichtgewichtigen Router aus, der in Go geschrieben ist.
- ECS Fargate: Hostet unser initiales Such-Backend unter Verwendung von SearXNG.
Wir haben uns für den Router Go entschieden, da es schnell ist und wenig Speicher verbraucht. Es eignet sich perfekt als kleine Lambda-Funktion. Dieses Setup skaliert automatisch mit zunehmender Nutzung.
Wir haben außerdem eine hexagonale Architektur verwendet. Das bedeutet, dass die Kernlogik völlig unabhängig davon ist, welche Suchmaschine Sie verwenden. Heute nutzen wir SearXNG. Morgen können wir einfach zu einem kommerziellen Anbieter wechseln, indem wir einen neuen Adapter hinzufügen. Die Nutzer werden eine Änderung niemals bemerken.
Das Ziel ist einfach. Wir stellen die Suchdaten bereit. Der KI-Agent übernimmt das Reasoning und die Antworten.
Durch die Zentralisierung dieses Dienstes müssen sich die Teams keine Sorgen mehr um Such-APIs machen und können sich stattdessen darauf konzentrieren, bessere KI-Lösungen zu entwickeln.
Optional learning community: https://t.me/GyaanSetuAi