206 918 votes
Obj : 250 000 Légende Discutez, votez et aidez-nous à atteindre cet objectif !
Vos votes sont importants : ils alimentent le jeu de données compar:IA mis à disposition librement pour affiner les prochains modèles sur le français.
Ce commun numérique contribue au meilleur respect de la diversité linguistique et culturelle des futurs modèles de langue.

Modalités d’utilisation

1. Champ d’application

L’accès à la plateforme est gratuit, sans inscription et entraîne l’application de conditions spécifiques, listées dans les présentes modalités d’utilisation.

2. Définitions

« Utilisateur » désigne toute personne physique consultant la plateforme et qui bénéficie de ses services.

« Éditeur » désigne le Service du numérique du Ministère de la Culture.

« Plateforme » désigne le site web qui rend les services accessibles.

« Modèles » désigne les grands modèles de langage (LLM) réutilisés dans le cadre de leur licence d’utilisation par la plateforme pour répondre à ses finalités.

« Services » désigne les fonctionnalités offertes par la plateforme pour répondre à ses finalités.

3. Description de la plateforme

Édité par le Service du numérique du Ministère de la Culture, le comparateur est une plateforme de comparaison des modèles conversationnels adressée au grand public dans le but (1) de sensibiliser les citoyens aux grands modèles de langage (LLMs), (2) de collecter les préférences des utilisateurs pour constituer des jeux de données d’alignement.

L’utilisateur ou l’utilisatrice pose une question en français et obtient des réponses de deux grands modèles de langages (LLM) anonymes. Il ou elle vote pour le modèle qui fournit la réponse qu’il préfère et se voit alors révélée l’identité des modèles. Ce dispositif de production participative inspiré de la plateforme « chatbot arena » (LMSYS) permet de constituer des jeux de données de préférences humaines sur des tâches réelles, en français, utilisables pour l’alignement des modèles.

Ces jeux de données seront rendus accessibles sous licence ouverte, notamment pour favoriser des usages de recherche.

4. Fonctionnalités

Afin de répondre au double objectif de sensibiliser les citoyens aux grands modèles de langage et collecter les préférences des utilisateurs et utilisatrices, les services rendus par la plateforme sans restriction d’accès sont les suivants :

  • Une interface humain-machine permettant de dialoguer simultanément avec deux modèles conversationnels et de voter pour la réponse préférée.

Les modèles intégrés à la plateforme sont déployés sur les serveurs d’inférence des différents hébergeurs et éditeurs de modèles. Les requêtes sont gérées notamment par le service Open Router. Les conditions de standardisation d’inférence sont renseignées sur la plateforme pour garantir la transparence d’utilisation des modèles.

  • Une interface de comparaison des modèles.

L’utilisateur peut consulter la liste des modèles intégrés au comparateur et accéder à une liste d’informations sur ces modèles.

  • Partage, mise à disposition et valorisation des jeux de données issus de la collecte des préférences des utilisateurs.

Le service collecte les données de dialogue (questions, réponses des deux modèles) et les préférences des utilisateurs (vote, métadonnées associées). Ces données servent à la fois à constituer des jeux de données partagés et à établir un classement des modèles d'IA affiché sur la plateforme, basé sur les votes exprimés.

L’éditeur se réserve le droit de distribuer sous licence ouverte 2.0 les données de dialogue et de préférence de l’utilisateur. Le jeu de données est diffusé sur la plateforme Hugging Face à travers le compte du ministère de la culture (https://huggingface.co/ministere-culture).

5. Responsabilités

L’utilisateur est responsable des données ou contenus qu'il ou elle saisit dans l’invite offert par la plateforme.

La plateforme n’a pas vocation à être utilisée pour générer des contenus illicites ou contraires à l’ordre public et plus généralement toute génération de contenu contrevenant au cadre juridique en vigueur.

A cet égard, l’utilisateur ne saisit pas dans l’invite des contenus ou informations contraires aux dispositions légales et réglementaires en vigueur.

Les données saisies par l’utilisateur sur la plateforme ayant vocation à être mises à disposition, il ou elle s’engage à ne pas transmettre d’informations permettant de l’identifier ou d’identifier un tiers.

En tout état de cause, l’éditeur s’engage à mettre en œuvre les moyens permettant de s'assurer de l'anonymisation des données de dialogue avant leur mise à disposition. Si, malgré les efforts de l'éditeur, des données sensibles venaient à être publiées dans les jeux de données, vous pouvez le signaler immédiatement via ce formulaire : [https://adtk8x51mbw.eu.typeform.com/to/B49aloXZ](https://adtk8x51mbw.eu.typeform.com/to/B49aloXZ).

De manière générale, l’éditeur se dégage de toute responsabilité en cas d’utilisationnon-conforme aux modalités d’utilisation.

6. Code et licences

Le code source de la plateforme est libre et disponible ici : https://github.com/betagouv/languia

Les LLM utilisés pour alimenter les services sont régis par les licences suivantes :

Modèle d’IA conversationnelleLien vers la notice des modèlesLicence
Apertus 70B Instructhttps://huggingface.co/swiss-ai/Apertus-70B-Instruct-2509Apache 2.0
Claude 4.5 Sonnethttps://www.anthropic.com/news/claude-sonnet-4-5proprietary
Command Ahttps://huggingface.co/CohereForAI/c4ai-command-a-03-2025CC-BY-NC-4.0
DeepSeek v3.1https://huggingface.co/deepseek-ai/DeepSeek-V3.1MIT
DeepSeek R1 0528https://huggingface.co/deepseek-ai/DeepSeek-R1-0528MIT
Gemini 2.5 FlashNon disponibleproprietary
Gemini 3 Prohttps://blog.google/products/gemini/gemini-3/#note-from-ceoproprietary
Gemma 3 12Bhttps://huggingface.co/google/gemma-3-12b-itGemma
Gemma 3 27Bhttps://huggingface.co/google/gemma-3-27b-itGemma
Gemma 3 4Bhttps://huggingface.co/google/gemma-3-4b-itGemma
Gemma 3n 4BNon disponibleGemma
GLM 4.5Non disponibleMIT
GLM 4.6Non disponibleMIT
GPT 5Non disponibleproprietary
GPT 5 Minihttps://platform.openai.com/docs/models/gpt-5-miniproprietary
GPT 5 Nanohttps://platform.openai.com/docs/models/gpt-5-nanoproprietary
GPT 5.1Non disponibleproprietary
GPT OSS-120BNon disponibleApache 2.0
GPT OSS-20BNon disponibleApache 2.0
Grok 4 Fasthttps://x.ai/news/grok-4-fastproprietary
Grok 4.1 Fasthttps://x.ai/news/grok-4-1-fastproprietary
Hermes 4 70BNon disponibleLlama 3.1
Kimi K2https://huggingface.co/moonshotai/Kimi-K2-InstructMIT
Kimi K2 Thinkinghttps://moonshotai.github.io/Kimi-K2/thinking.htmlMIT
LFM 2 8B A1Bhttps://www.liquid.ai/blog/lfm2-8b-a1b-an-efficient-on-device-mixture-of-expertsLFM 1.0
Llama 3.1 8Bhttps://huggingface.co/meta-llama/Meta-Llama-3.1-8B-InstructLlama 3.1
Llama 3.3 70Bhttps://huggingface.co/meta-llama/Llama-3.3-70B-InstructLlama 3.3
Llama 4 Scouthttps://huggingface.co/meta-llama/Llama-4-Scout-17B-16E-InstructLlama 4
Llama 4 MaverickNon disponibleLlama 4
Magistral MediumNon disponibleproprietary
Magistral SmallNon disponibleApache 2.0
MiniMax M2https://www.minimax.io/news/minimax-m2MIT
Mistral Medium 2508https://mistral.ai/news/mistral-medium-3proprietary
Mistral Medium 3.1Non disponibleproprietary
Mistral Small 3.2Non disponibleApache 2.0
o4 minihttps://platform.openai.com/docs/models/o4-miniproprietary
Olmo 3 32B Thinkhttps://allenai.org/blog/olmo2-32bApache 2.0
Phi-4https://huggingface.co/microsoft/Phi-4MIT
Qwen 3 8Bhttps://huggingface.co/Qwen/Qwen3-8B-AWQApache 2.0
Qwen 3 30B A3BNon disponibleApache 2.0
Qwen 3 32Bhttps://huggingface.co/Qwen/Qwen3-32BApache 2.0
Qwen3 Coder 480B A35Bhttps://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-InstructApache 2.0
Qwen 3 Maxhttps://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-listproprietary

La liste des modèles de langage intégrés à la plateforme est susceptible d’évoluer au cours du temps et est mise à jour à chaque modification.

7. Disponibilité des services

La plateforme est accessible, sauf cas de force majeure ou d’évènement hors de contrôle de son éditeur.

L’éditeur se réserve le droit de suspendre, d'interrompre ou de limiter, sans avis préalable, l'accès à tout ou partie des services, notamment pour des opérations de maintenance et de mises à jour nécessaires au bon fonctionnement du service et des matériels afférents, ou pour toute autre raison, notamment technique.

Il n’est pas garanti que le service soit exempt d’anomalies ou d'erreurs. Le service est donc mis à disposition sans garantie sur sa disponibilité et ses performances.

A ce titre, l’éditeur ne saurait être tenu responsable des pertes ou préjudices, de quelque nature qu’ils soient, qui pourraient être causés à la suite d’un dysfonctionnement ou une indisponibilité du service. De telles situations n'ouvriront droit à aucune compensation financière.

8. Évolution des modalités d'utilisation

Les modalités d’utilisation peuvent être modifiées ou complétées à tout moment, sans préavis, en fonction des modifications apportées aux services, de l’évolution de la législation ou pour tout autre motif jugé nécessaire.

Ces modifications et mises à jour s’imposent à l’utilisateur ou l’utilisatrice qui doit, en conséquence, se référer régulièrement à cette rubrique pour vérifier les modalités générales en vigueur.

9. Contact

Pour toute question sur le service, vous pouvez écrire à contact@comparia.beta.gouv.fr.