#Prompting — Fito Damour Notes

Automatisation21 mai 20266 min de lecture

Diète de tokens : Caveman vs RTK pour réduire coûts et latence des LLM

Réduisez coûts et latence des LLM avec deux formats d'output (Caveman et RTK) + modèles de prompts et règles de choix.