Tag. inférence locale

Modèles (5)

La version ultra-légère de Llama. En 1B et 3B, ce modèle est pensé pour tourner directement sur mobile ou sur du matériel très modeste.

Une gamme de SLMs (Small Language Models) avec un bon support multilingue et de solides capacités en code, de 1.5B à 7B.

Évolution du Phi-3 Mini. Toujours 3.8B de paramètres, mais avec une attention multi-requêtes (MQA) et une fenêtre de contexte de 128k.

Modèle compact (3.8B) de Microsoft, optimisé pour les appareils avec peu de ressources. Il raisonne bien malgré sa petite taille.

La nouvelle génération de modèles ouverts par Meta. De bons résultats pour sa taille, adapté à l'inférence locale et au raisonnement.