Toutes les ressources de la plateforme relatives au sujet nvidia.
Un modèle performant de 30B optimisé par NVIDIA, disponible en version GGUF pour une utilisation efficace sur matériel grand public.
NVIDIA proposent une version optimisée du Nemotron-3-Nano-30B-A3B. Voici comment le faire tourner en local avec llama.cpp, du CPU au GPU.