𝗘-𝗠𝗮𝗶𝗹-𝗧𝗿𝗶𝗮𝗴𝗲-𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝗻 𝗳ü𝗿 𝗟𝗟𝗠-𝗞𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝘇𝗶𝗲𝗿𝘂𝗻𝗴

Der wichtigste Teil eines E-Mail-Klassifizierers ist nicht das Modell. Es ist der Labelsatz.

Die meisten Menschen konzentrieren sich auf die Formulierung des Prompts. Sie vergessen, dass die Labels die eigentliche Arbeit leisten. Wenn die Taxonomie stimmt, funktioniert auch ein günstiges Modell gut. Wenn sie falsch ist, kann kein Modell Sie retten.

Eine erfolgreiche E-Mail-Taxonomie sollte diesen Regeln folgen:

Berücksichtigen Sie diese vierteilige Struktur:

Jedes Label entspricht einem spezifischen Verhalten. Wenn zwei Labels zur gleichen Aktion führen, führen Sie sie zusammen. Wenn ein Label zu zwei verschiedenen Aktionen führt, teilen Sie es auf.

Dieser Ansatz macht Agenten vorhersehbar. Sie können sie nach einem Zeitplan ohne ständige Überwachung ausführen. Verwenden Sie eine Temperatur von 0 für die Klassifizierung, um sicherzustellen, dass die Ausgabe deterministisch ist. Verwenden Sie eine höhere Temperatur für das Erstellen von Entwürfen, um eine natürliche Prosa zu erhalten.

Verwenden Sie keine Freitext-Tags. Jedes neue Tag erzeugt einen neuen Code-Pfad, den Sie testen müssen. Ein geschlossener Wortschatz macht Ihr System einfach zu auditieren und zu skalieren.

Versuchen Sie diese Übung: Nehmen Sie Ihre letzten 50 E-Mails. Kategorisieren Sie diese in diese vier Töpfe. Notieren Sie, wo Sie zögern. Diese Lücken zeigen Ihnen, wo Ihre Definitionen mehr Beispiele benötigen.

Quelle: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

Optionale Lern-Community: https://t.me/GyaanSetuAi