Liste des modèles - compar:IA, le comparateur d'IA conversationnelles

42 modèles

Trier par

Swiss AI/Apertus 8B Instruct

Petit modèle entièrement open source, incluant ses données, ses poids et son code d’entraînement, développé par un consortium d’institutions suisses. Il a été entraîné sur plus de 1 800 langues à partir de 15 000 milliards de tokens issus exclusivement de sources publiques et à licences ouvertes, garantissant une transparence totale. Entraîné sur le supercalculateur Alps du CSCS à Lugano, alimenté par une énergie hydroélectrique neutre en carbone, il incarne une approche plus durable et éthique du développement de l’IA. Il a été conçu dès le départ pour être conforme à l’AI Act.

Nouveau
Semi-ouvert
Sortie 09/2025
8 mds de paramètres

Cohere/Aya Expanse 32B

Modèle de taille moyenne multilingue, capable de traiter 23 langues.

Semi-ouvert
Sortie 12/2024
32 mds de paramètres

Anthropic/Claude 4 Sonnet

Très grand modèle multimodal et multilingue très puissant en code. L'utilisateur ou le développeur qui utilise ce modèle peut choisir entre plusieurs niveaux de raisonnement.

Propriétaire
Sortie 05/2025
Taille estimée (XL)

Anthropic/Claude 4.5 Sonnet

Très grand modèle multimodal et multilingue, extrêmement performant en code, en raisonnement et en mathématiques. L'utilisateur ou le développeur qui utilise ce modèle peut choisir entre plusieurs niveaux de raisonnement.

Nouveau
Propriétaire
Sortie 09/2025
Taille estimée (XL)

Cohere/Command A

Grand modèle, performant pour la programmation, l’utilisation d’outils externes, la “génération augmentée de récupération” (RAG, retrieval augmented generation).

Semi-ouvert
Sortie 03/2025
111 mds de paramètres

DeepSeek/DeepSeek R1 0528

Modèle de très grande taille, spécialisé dans les tâches mathématiques, scientifiques et de programmation. Il simule une étape de raisonnement avant de générer sa réponse et avec la mise à jour de mai 2025 a gagné en profondeur d’analyse et en précision grâce à une optimisation du post-entraînement.

Semi-ouvert
Sortie 05/2025
685 mds de paramètres

DeepSeek/DeepSeek R1 Llama 70B

Grand modèle basé sur Meta Llama 3.3 70B, ré-entraîné avec des exemples de raisonnement issus du modèle DeepSeek R1. Il offre de bonnes capacités en mathématiques et code.

Semi-ouvert
Sortie 01/2025
70 mds de paramètres

DeepSeek/DeepSeek v3.1

Très grand modèle conçu pour des tâches complexes : génération de code, analyse de documents longs. Cette version est particulièrement forte en utilisation d’outils et peut simuler une phase de raisonnement avant de fournir la réponse finale.

Nouveau
Semi-ouvert
Sortie 08/2025
685 mds de paramètres

Google/Gemini 2.5 Flash

Grand modèle multimodal et multilingue avec deux modalités de réponses: l’utilisateur peut choisir entre un mode de raisonnement, pour des réponses plus approfondies, ou un mode rapide, pour générer directement à la réponse finale.

Nouveau
Propriétaire
Sortie 06/2025
Taille estimée (XL)

Google/Gemma 3 12B

Petit modèle multimodal adapté aux tâches courantes comme les questions-réponses, les résumés ou l’interprétation d’images.

Semi-ouvert
Sortie 03/2025
12 mds de paramètres

Google/Gemma 3 27B

Modèle de taille moyenne multimodal adapté aux tâches courantes comme les questions-réponses, les résumés ou l’interprétation d’images.

Semi-ouvert
Sortie 03/2025
27 mds de paramètres

Google/Gemma 3 4B

Très petit modèle multimodal et compact adapté aux tâches courantes comme les questions-réponses, les résumés ou l’interprétation d’images.

Semi-ouvert
Sortie 03/2025
4 mds de paramètres

Google/Gemma 3n 4B

Très petit modèle multimodal et compact conçu pour fonctionner localement sur un ordinateur ou un smartphone, sans recours à un serveur - il est capable d’adapter sa puissance selon la capacité de la capacité et le besoin.

Nouveau
Semi-ouvert
Sortie 05/2025
8 mds de paramètres

Zhipu/GLM 4.5

Très grand modèle créé par Zhipu AI, un éditeur de modèles d’IA Chinois créé en 2019 par des professeurs de l’université de Tsinghua et soutenu par des grands acteurs comme Alibaba et Tencent. Le modèle a deux modalités de réponses: l’utilisateur peut choisir entre un mode de raisonnement, pour des réponses plus approfondies, ou un mode rapide, pour générer directement la réponse finale.

Semi-ouvert
Sortie 07/2025
355 mds de paramètres

Zhipu/GLM 4.6

Mise à jour du grand modèle créé par Zhipu AI - GLM 4.6, un éditeur de modèles d’IA Chinois créé en 2019 par des professeurs de l’université de Tsinghua et soutenu par des grands acteurs comme Alibaba et Tencent. Cette mise à jour augmente la taille de la fenêtre de contexte, améliore sa performance en code, s'aligne plus avec les préférences humaines et est plus capable en cas d'usages agentiques/utilisation d'outils.

Nouveau
Semi-ouvert
Sortie 09/2025
357 mds de paramètres

OpenAI/GPT 4.1 Nano

Plus petite version allégée du modèle GPT 4.1 , conçue pour limiter les coûts tout en restant compétitive sur la plupart des tâches. Le modèle accepte de très longues requêtes, ce qui permet de l’utiliser par exemple pour l’analyse de corpus de documents.

Propriétaire
Sortie 04/2025
Taille estimée (M)

OpenAI/GPT 5

Le GPT-5 n'est pas un modèle unique, mais un système unifié composé de deux modèles distincts : un modèle rapide (gpt-5-main) pour les requêtes courantes et un modèle de raisonnement (gpt-5-thinking) pour les problèmes complexes. Comparé à ses prédécesseurs, OpenAI affirme qu'il est plus utile dans les requêtes du monde réel, avec des améliorations notables dans les domaines de l'écriture, du codage et de la santé. Il réduit également le phénomène des hallucinations. Grâce à sa fenêtre de contexte de 400 000 jetons, il peut accepter de longues requêtes, ce rend possible l'analyse de plusieurs documents à la fois.

Nouveau
Propriétaire
Sortie 08/2025
Taille estimée (XL)

OpenAI/GPT 5 Mini

Le GPT-5 Mini est une version allégée du modèle GPT-5 principal. Il est conçu pour être utilisé dans des environnements où il est nécessaire de limiter les coûts, par exemple à grande échelle. Son modèle de raisonnement est presque aussi performant que celui du modèle principal (gpt-5-thinking) malgré sa taille plus petite. Grâce à sa fenêtre de contexte de 400 000 jetons, il peut accepter de longues requêtes, ce rend possible l'analyse de plusieurs documents à la fois.

Nouveau
Propriétaire
Sortie 08/2025
Taille estimée (M)

OpenAI/GPT 5 Nano

Le GPT-5 Nano est la plus petite et la plus rapide version du modèle de raisonnement GPT-5. Il est conçu pour des contextes où une latence ou un coût ultra-faible est nécessaire. Grâce à sa fenêtre de contexte de 400 000 jetons, il peut accepter de longues requêtes, ce rend possible l'analyse de plusieurs documents à la fois.

Nouveau
Propriétaire
Sortie 04/2025
Taille estimée (S)

OpenAI/GPT OSS-120B

Le plus grand des deux premiers modèles semi-ouverts d'OpenAI depuis GPT-2. Conçu en réponse à la montée en puissance des acteurs open source comme Meta (LLaMA) et Mistral, il s'agit d'un modèle de raisonnement performant, notamment sur des tâches complexes et dans des environnements « agentiques ».

Nouveau
Semi-ouvert
Sortie 08/2025
117 mds de paramètres

OpenAI/GPT OSS-20B

Le plus petit des deux modèles semi-ouverts d'OpenAI. Il a été conçu en réponse à la concurrence de l'open source et est destiné aux cas d'utilisation nécessitant une faible latence ainsi qu'aux déploiements locaux ou spécialisés.

Nouveau
Semi-ouvert
Sortie 08/2025
21 mds de paramètres

OpenAI/GPT-4.1 Mini

Version allégée de GPT 4.1 mais qui reste tout de même de grande taille, conçue pour limiter les coûts tout en restant compétitif sur la plupart des tâches. Le modèle accepte de très longues requêtes, ce qui permet de l’utiliser par exemple pour l’analyse de corpus de documents.

Propriétaire
Sortie 04/2025
Taille estimée (L)

xAI/Grok 4 Fast

Grok 4 Fast est un modèle axé sur l'équilibre entre performance, vitesse et coût, notamment pour des tâches de recherche d'information et d'autres actions "agentiques".

Nouveau
Propriétaire
Sortie 09/2025
Taille estimée (XL)

Nous/Hermes 4 70B

Grand modèle réentraîné à partir du Llama 3.1 70B, ajusté pour mieux répondre aux demandes et instructions stylistiques des utilisateurs.

Nouveau
Semi-ouvert
Sortie 08/2025
70 mds de paramètres

Moonshot AI/Kimi K2

Développé par Moonshot AI (亦称「月之暗面」/ Yue Zhi An Mian), une société basée à Pékin, Kimi K2 est un très grand modèle orienté code et usages agentiques. Il est reconnu pour les tâches de développement dans des contextes agentiques (par ex. dans Cursor ou Windsurf) notamment pour son rôle en tant qu’orchestrateur. Il n’expose pas de “mode raisonnement” explicite, mais pour les grandes tâches il sous-divise sa réponse en étapes et alterne entre actions (appels d’outils) et rédaction de texte.

Nouveau
Semi-ouvert
Sortie 09/2025
1000 mds de paramètres

Meta/Llama 3.1 8B

Petit modèle conçu pour un usage local sur ordinateur portable, tout en offrant de bonnes capacités pour la synthèse de texte et les réponses simples.

Semi-ouvert
Sortie 07/2024
8 mds de paramètres

Meta/Llama 3.3 70B

Grand modèle destiné à un large éventail de tâches et pouvant rivaliser avec des modèles plus volumineux.

Semi-ouvert
Sortie 12/2024
70 mds de paramètres

Meta/Llama 4 Maverick

Très grand modèle doté d’une très large fenêtre de contexte, adapté par exemple au résumé de plusieurs documents en même temps.

Semi-ouvert
Sortie 04/2025
400 mds de paramètres

Meta/Llama 4 Scout

Grand modèle doté d’une très large fenêtre de contexte, adapté par exemple à la synthèse d'un ensemble de documents.

Semi-ouvert
Sortie 04/2025
109 mds de paramètres

Mistral AI/Magistral Medium

Modèle de raisonnement de taille moyenne multimodal et multilingue. Adapté à des tâches de programmation ou autres tâches nécessitant analyse approfondie compréhension de systèmes logiques complexes ou planification - par exemple pour des cas d’usages agentiques ou de la rédaction de longs contenus complexes.

Nouveau
Propriétaire
Sortie 06/2025
Taille estimée (L)

Mistral AI/Magistral Small

Modèle de raisonnement de taille moyenne, multimodal et multilingue. Adapté à des tâches nécessitant une analyse approfondie, compréhension de systèmes logiques ou planification - par exemple pour des cas d’usages agentiques ou de la rédaction de longs contenus complexes.

Nouveau
Semi-ouvert
Sortie 06/2025
24 mds de paramètres

Mistral AI/Mistral Medium 2508

Modèle de taille moyenne multilingue, multimodal et peu couteux par rapport à d’autres modèles qui offrent des performances similaires. Il est devenu particulièrement intéressant après une mise à jour en août 2025 avec des améliorations importantes de performance générale, un ton "amélioré" et une meilleure capacité de chercher des informations sur Internet.

Nouveau
Propriétaire
Sortie 08/2025
Taille estimée (L)

Mistral AI/Mistral Medium 3.1

Modèle de taille moyenne multilingue, multimodal et peu couteux par rapport à d’autres modèles qui offrent des performances similaires. Il est particulièrement intéressant pour des tâches de programmation ou des tâches de raisonnement, par exemple les mathématiques.

Nouveau
Propriétaire
Sortie 08/2025
Taille estimée (L)

Mistral AI/Mistral Saba

Modèle de taille moyenne conçu pour une compréhension linguistique et culturelle fine des langues du Moyen-Orient et d’Asie du Sud, notamment l’arabe, le tamoul et le malayalam.

Propriétaire
Sortie 02/2025
Taille estimée (M)

Mistral AI/Mistral Small 3.2

Malgré son nom, c’est un modèle de taille moyenne. Il est multimodal (capable de traiter texte et images) et il se démarque par un respect précis des requêtes et sa capacité à utiliser des outils avancées.

Nouveau
Semi-ouvert
Sortie 06/2025
24 mds de paramètres

OpenAI/o4 mini

Très grand modèle de raisonnement, adapté pour des tâches et questions scientifiques et technologiques complexes.

Propriétaire
Sortie 04/2025
Taille estimée (S)

Microsoft/Phi-4

Petit modèle multilingue, capable d’utiliser des outils et performant sur des tâches complexes comme la logique, les mathématiques et le code, tout en restant compact.

Semi-ouvert
Sortie 12/2024
14 mds de paramètres

Alibaba/Qwen 3 30B A3B

Modèle de taille moyenne multilingue.

Nouveau
Semi-ouvert
Sortie 05/2025
30 mds de paramètres

Alibaba/Qwen 3 32B

Modèle de taille moyenne multilingue avec deux modalités de réponses: l’utilisateur peut choisir entre un mode de raisonnement, pour des réponses plus approfondies, ou un mode rapide, pour générer directement la réponse finale.

Semi-ouvert
Sortie 04/2025
32 mds de paramètres

Alibaba/Qwen 3 8B

Petit modèle multilingue dense de la famille Qwen 3, offrant un mode “raisonnement” pour des tâches complexes (mathématiques, code) et un mode “réponse directe” pour des réponses plus rapides.

Nouveau
Semi-ouvert
Sortie 07/2025
8 mds de paramètres

Alibaba/Qwen 3 Max

Parmi les rares modèles propriétaires de Qwen, celui-ci est le plus grand et le plus puissant de la troisième génération. Il a été entraîné avec une attention particulière à l’usage en entreprise et aux cas d’utilisation agentiques.

Nouveau
Propriétaire
Sortie 09/2025
Taille estimée (XL)

Alibaba/Qwen3 Coder 480B A35B

Très grand modèle spécialisé dans la génération de code, analyse de dépôts entiers et résolution de problèmes multi-étapes. Cette version est particulièrement forte en utilisation d’outils et peut simuler une phase de raisonnement avant de fournir la réponse finale.

Nouveau
Semi-ouvert
Sortie 07/2025
480 mds de paramètres