siliconcloud
DeepSeek R1 Distill Qwen 14B
DeepSeek-R1-Distill-Qwen-14B est un modèle obtenu par distillation de Qwen2.5-14B. Ce modèle a été affiné à l'aide de 800 000 échantillons sélectionnés générés par DeepSeek-R1, montrant d'excellentes capacités de raisonnement. Il a obtenu d'excellents résultats dans plusieurs tests de référence, atteignant 93,9 % de précision sur MATH-500, 69,7 % de taux de réussite sur AIME 2024, et un score de 1481 sur CodeForces, montrant une forte puissance dans les domaines des mathématiques et de la programmation.