33 modèles
Swiss AI/Apertus 70B Instruct
Modèle open source et reproductible de taille moyenne, développé par un consortium d'institutions suisses. Ses poids et son code d'entraînement sont publiés sous licence permissive. Il a été entraîné sur plus de 1 800 langues sur plus de 15 000 milliards de jetons. L'entraînement a eu lieu sur le supercalculateur Alps du CSCS à Lugano, alimenté par une énergie hydroélectrique neutre en carbone.
Anthropic/Claude 4.6 Sonnet
Très grand modèle multimodal et multilingue, très performant en code, en utilisation autonome d'ordinateur et en raisonnement. L'utilisateur ou le développeur peut choisir entre plusieurs niveaux de raisonnement.
DeepSeek/DeepSeek V4 Flash
Version réduite et plus économique de DeepSeek V4 Pro, qui conserve la même fenêtre d'un million de jetons en entrée pour l'analyse de très longs documents. Son tarif d'API se situe parmi les plus bas de sa catégorie pour le traitement du long contexte, à un niveau de performance comparable à celui des modèles intermédiaires propriétaires, ce qui en fait une option intéressante en termes de rapport coût/performance. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
DeepSeek/DeepSeek V4 Pro
Très grand modèle conçu pour analyser de très longs documents (jusqu'à un million de jetons en entrée, soit l'équivalent de plusieurs livres) et pour les tâches agentiques comme la génération de code et l'utilisation d'outils. Son tarif d'API est inférieur à celui des principaux modèles propriétaires de niveau comparable, ce qui en fait une option à considérer en termes de rapport coût/performance. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
EuroLLM/EuroLLM 22B Instruct
Modèle multilingue conçu spécifiquement pour la diversité linguistique européenne, avec de fortes capacités en traduction et compréhension multilingue.
Google/Gemini 3 Flash
Grand modèle multimodal natif et multilingue, distillé depuis Gemini 3 Pro. Il intègre une capacité de raisonnement avancée ("Deep Think") activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur. Le modèle prend en charge nativement le texte, le code, l'audio, l'image, la vidéo et les PDF.
Google/Gemini 3.1 Flash Lite
Modèle de taille moyenne, multimodal et rapide, adapté à un usage automatisé ou des tâches relativement simples : traduction, classification, modération de contenu. Il propose des niveaux de raisonnement ajustables, du minimal au plus approfondi.
Google/Gemini 3.1 Pro
Très grand modèle multimodal natif et multilingue, évolution de Gemini 3 Pro. Il reprend les mêmes capacités multimodales et le mode de raisonnement ("Deep Think"), en ajoutant un troisième niveau de raisonnement intermédiaire et des améliorations sur les tâches de planification et d'utilisation d'outils.
Google/Gemini 3.5 Flash
Modèle multimodal de Google destiné aux tâches agentiques en plusieurs étapes et à la génération de code, avec entrées texte, image, vidéo, audio et PDF. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
- Nouveau
Google/Gemma 4 26B A4B
Variante à mélange d'experts (MoE, Mixture of Experts) de la famille Gemma 4, ce modèle multimodal multilingue offre des performances proches de la version dense 31B pour un coût d'inférence bien inférieur. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
Google/Gemma 4 31B
Variante dense de la famille Gemma 4, ce modèle de taille moyenne multimodal est performant en génération de code, raisonnement et compréhension de documents. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
Zhipu/GLM 5.1
Très grand modèle conçu pour des tâches complexes : ingénierie logicielle, orchestration agentique et raisonnement avancé. Il simule une étape de raisonnement avant de générer sa réponse. Cette version améliore sensiblement les performances en code et en exécution autonome prolongée par rapport à GLM 5.
OpenAI/GPT 5.4 Mini
Version compacte de GPT 5.4, conçue pour offrir un bon compromis entre performances et coût. Adapté à la génération de code, aux systèmes agentiques et à l'utilisation autonome d'un ordinateur. Il peut simuler une étape de raisonnement avant de générer sa réponse.
OpenAI/GPT 5.4 Nano
Plus petit et plus économique modèle de la famille GPT 5.4, conçu pour les tâches à fort volume comme la classification, l'extraction de données ou le tri. Il peut simuler une étape de raisonnement avant de générer sa réponse.
OpenAI/GPT 5.5
Modèle multimodal (entrées texte et image) qui se distingue surtout de GPT 5.4 par un saut important sur deux axes : la récupération d'information dans les très longs contextes (où il double pratiquement le score de la version précédente) et les tâches agentiques de programmation et d'utilisation d'un ordinateur. Selon l'éditeur, ses affirmations sont 23 % plus souvent factuellement correctes que celles de GPT 5.4 ; en revanche, lorsqu'il se trompe, il a tendance à inventer une réponse plutôt qu'à reconnaître son ignorance. Il simule une étape de raisonnement avant de générer sa réponse, avec cinq niveaux d'effort paramétrables.
OpenAI/GPT OSS-120B
Le plus grand des deux premiers modèles semi-ouverts d'OpenAI depuis GPT-2. Conçu en réponse à la montée en puissance des acteurs open source comme Meta (LLaMA) et Mistral, il s'agit d'un modèle de raisonnement performant, notamment sur des tâches complexes et dans des environnements « agentiques ».
OpenAI/GPT OSS-20B
Le plus petit des deux modèles semi-ouverts d'OpenAI. Il a été conçu en réponse à la concurrence de l'open source et est destiné aux cas d'utilisation nécessitant une faible latence ainsi qu'aux déploiements locaux ou spécialisés.
IBM/Granite 4.1 8B
Petit modèle multilingue conçu pour les usages d'entreprise, offrant de bonnes capacités en utilisation d'outils externes, en génération augmentée de récupération (RAG, retrieval augmented generation) et en génération de code.
- Nouveau
Moonshot AI/Kimi K2.5
Construit à partir de Kimi K2, l'éditeur à continué le pré-entraînement sur environ 15 billions de jetons supplémentaires, mêlant texte et données visuelles. L’éditeur met en avant sa multimodalité native ainsi que ses capacités agentiques, particulièrement adaptées à des tâches comme le développement logiciel.
Moonshot AI/Kimi K2.6
Très grand modèle ouvert conçu par Moonshot AI, qui se distingue par un mode agentique capable de coordonner jusqu'à 300 sous-agents travaillant en parallèle sur une même tâche complexe. Il est nativement multimodal (texte, image, vidéo) et dispose d'un mode de raisonnement. Selon l'éditeur, il rivalise avec les meilleurs modèles propriétaires comme Claude Opus 4.6 et GPT-5.4 sur plusieurs tests d'ingénierie logicielle, tout en étant publié en poids ouverts.
Liquid/LFM2 24B A2B
Modèle ouvert conçu par Liquid AI pour un déploiement efficace, y compris en local sur un ordinateur puissant. Sa particularité est de générer du texte nettement plus rapidement qu'un modèle de taille équivalente, grâce à une architecture qui sort des sentiers battus des modèles dominants actuels.
Meta/Llama 4 Maverick
Très grand modèle doté d’une très large fenêtre de contexte, adapté par exemple au résumé de plusieurs documents en même temps.
Meta/Llama 4 Scout
Grand modèle doté d’une très large fenêtre de contexte, adapté par exemple à la synthèse d'un ensemble de documents.
MiniMax/MiniMax M2.7
Très grand modèle semi-ouvert spécialisé dans le code et les tâches agentiques, conçu par MiniMax, entreprise basée à Shanghai. Il est présenté par l'éditeur comme un modèle « auto-évolutif » : il optimise de manière autonome ses propres méthodes de résolution de tâches, avec un gain de performance significatif revendiqué. Selon l'éditeur, il rivalise avec les meilleurs modèles propriétaires sur l'ingénierie logicielle tout en étant publié en poids ouverts.
Mistral AI/Mistral 3 Large
Très grand modèle multimodal semi-ouvert performant en code et contextes multilingues.
Mistral AI/Mistral Medium 3.1
Modèle de taille moyenne multilingue, multimodal et peu couteux par rapport à d’autres modèles qui offrent des performances similaires. Il est devenu particulièrement intéressant après une mise à jour en août 2025 avec des améliorations importantes de performance générale, un ton "amélioré" et une meilleure capacité de chercher des informations sur Internet.
Mistral AI/Mistral Small 4
Grand modèle semi-ouvert multimodal unifiant les capacités d'instruction, de raisonnement et de programmation agentique. Il simule une étape de raisonnement avant de générer sa réponse, avec un effort de raisonnement configurable.
Nvidia/Nemotron 3 Super 120B-A12B
Grand modèle de Nvidia, le fabricant de cartes graphiques, fondé sur une architecture hybride qui combine différents types de couches pour traiter efficacement de très longs documents tout en limitant le coût de calcul. Nvidia publie les poids, les recettes d'entraînement et une grande partie des données d'entraînement.
Alibaba/Qwen 3.5 35B A3B
Modèle de taille moyenne multimodal, multilingue et doté d'un mode de raisonnement. Malgré sa taille modeste, il rivalise avec des modèles beaucoup plus grands grâce à une architecture ultra-sparse qui n'active qu'une petite fraction de ses paramètres à chaque jeton.
Alibaba/Qwen 3.5 397B
Très grand modèle multimodal et multilingue doté d'un mode de raisonnement. Grâce à une architecture hybride combinant attention linéaire (Gated DeltaNet) et mélange d'experts, il n'active que 17 milliards de paramètres sur 397 milliards au total.
Alibaba/Qwen 3.6 Plus
Modèle phare de la nouvelle génération Qwen 3.6, conçu par Alibaba autour de l'« agentic coding » : il sait décomposer un projet de programmation, écrire le code, le tester et corriger ses propres erreurs jusqu'à aboutir à un résultat fonctionnel. Il se distingue aussi par une très grande fenêtre de contexte, qui lui permet d'ingérer des bases de code ou des corpus documentaires entiers. C'est l'un des rares modèles propriétaires publiés par Qwen, qui sort habituellement beaucoup de modèles en poids ouverts.
Alibaba/Qwen3.7 Max
Très grand modèle agentique, optimisé pour la génération de code et l'exécution autonome de tâches sur de longs horizons. Modèle phare propriétaire de la série Qwen3.7, ce qui reste rare au sein de cette série majoritairement ouverte. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
- Nouveau
Arcee/Trinity Large Thinking
Très grand modèle semi-ouvert américain créé par Arcee AI, une startup d'une trentaine de personnes. Il intègre une capacité de raisonnement avancée et a été spécifiquement post-entraîné pour les usages agentiques et l'utilisation d'outils externes.