#GGUF

1 article trouvé

NVIDIA proposent une version optimisée du Nemotron-3-Nano-30B-A3B. Voici comment le faire tourner en local avec llama.cpp, du CPU au GPU.