#Llama.cpp

2 articles trouvés

NVIDIA proposent une version optimisée du Nemotron-3-Nano-30B-A3B. Voici comment le faire tourner en local avec llama.cpp, du CPU au GPU.

Comment monter un environnement de dev IA sous Docker, sans dépendre d'API tierces ni faire fuiter votre code, via pi et llama.cpp.