𝗠𝗼𝗱𝗲𝗹 𝗦𝗵𝗼𝘄𝗱𝗼𝘄𝗻: 𝗟𝗼𝗰𝗮𝗹 𝘃𝘀. 𝗖𝗹𝗼𝘂𝗱 𝗖𝗼𝗱𝗶𝗻𝗴

📅3 hours ago⏱2 min read

Modell-Showdown: Lokales vs. Cloud-Coding

Fünf lokale Modelle. Ein Cloud-Modell. Eine echte Coding-Aufgabe.

Die Ergebnisse sind eindeutig. Lokale Modelle sind auf Consumer-Hardware noch nicht bereit für agentische Coding-Aufgaben.

Ich habe fünf lokale Modelle gegen Claude Sonnet 4 getestet. Das Ziel war der Bau eines Tag-Managers für ein Blog-Admin-Panel. Die Modelle mussten Code schreiben, Builds bestehen, Screenshots erstellen und Commits pushen.

The Results:

• Sonnet 4 (Cloud): Abgeschlossen. 4 Commits. 10 Minuten. Null menschliche Hilfe. • Qwen3-Coder 30B (Local): Teilweise. 1 Commit. Hat funktioniert, war aber unordentlich. • Qwen 3.6 35B (Local): Fehlgeschlagen. Build bestanden, aber nie committet. • Gemma 4 12B (Local): Fehlgeschlagen. In einer Schleife festgefahren. • Hermes 4 14B (Local): Fehlgeschlagen. Denselben Fehler 13 Mal wiederholt. • Devstral 24B (Local): Totalausfall. Konnte keine Tools nutzen.

The Efficiency Gap

Der Unterschied ist gewaltig. Sonnet 4 hat die Aufgabe mit 19K Token abgeschlossen. Die lokalen Modelle haben zwischen 1 Million und 4 Millionen Token verbraucht. Das ist eine 100- bis 200-fache Differenz in der Effizienz.

Lokale Modelle sind nicht nur langsamer. Sie haben Probleme mit dem logischen Denken. Ich habe vier Hauptprobleme festgestellt:

Degenerative Schleifen: Modelle wiederholen denselben falschen Code oder Text dutzendfach.
Verzeichnis-Amnesie: Modelle vergessen, wo sie sich im Dateisystem befinden.
Schlechte Priorisierung: Modelle konzentrieren sich auf unwichtige Aufgaben

𝗠𝗼𝗱𝗲𝗹 𝗦𝗵𝗼𝘄𝗱𝗼𝘄𝗻: 𝗟𝗼𝗰𝗮𝗹 𝘃𝘀. 𝗖𝗹𝗼𝘂𝗱 𝗖𝗼𝗱𝗶𝗻𝗴

Continue reading

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗮𝗿𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲, 𝗯𝘂𝘁 𝘁𝗵𝗲 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝘀 𝗦𝘁𝘂𝗰𝗸 𝗶𝗻 𝟮𝟬𝟭𝟬

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗶𝗻 𝟮𝟬𝟮𝟲 𝗯𝘂𝘁 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝗻 𝟮𝟬𝟭𝟬

Zwei Modelle auf einer GPU ausführen: Die Mathematik hinter lokalen LLMs

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀

𝗩𝗶𝗯𝗲 𝗖𝗼𝗱𝗶𝗻𝗴 𝟭𝟬𝟭: 𝗔 𝗚𝘂𝗶𝗱𝗲 𝗳𝗼𝗿 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀