Hermes Agent + llama.cpp : brancher un modèle local proprement

Tue, 07 Apr 2026 10:00:00 +0200

Hermes Agent est installé, la commande hermes répond, et tu as probablement déjà tapé deux ou trois messages avec un provider distant pour vérifier que tout tient debout. Bien. C’est le moment de lui brancher un vrai modèle local.

Ce tuto te donne le chemin le plus propre pour ça : un serveur llama.cpp, un modèle au format GGUF, un endpoint local compatible OpenAI, et Hermes qui pointe dessus. Pas de détour, pas de benchmark de modèles, pas de tunnel de flags avancés. Juste la chaîne qui marche, un premier test utile, et les erreurs qu’on voit revenir tout le temps.

Llama-Cpp on TekBrut — La tech sans filtre

Hermes Agent + llama.cpp : brancher un modèle local proprement