171 470 votes
Obj : 150 000 Légende Discutez, votez et aidez-nous à atteindre cet objectif !
Vos votes sont importants : ils alimentent le jeu de données compar:IA mis à disposition librement pour affiner les prochains modèles sur le français.
Ce commun numérique contribue au meilleur respect de la diversité linguistique et culturelle des futurs modèles de langue.

Modalités d’utilisation

1. Champ d’application

L’accès à la plateforme est gratuit, sans inscription et entraîne l’application de conditions spécifiques, listées dans les présentes modalités d’utilisation.

2. Définitions

« Utilisateur » désigne toute personne physique consultant la plateforme et qui bénéficie de ses services.

« Éditeur » désigne le Service du numérique du Ministère de la Culture.

« Plateforme » désigne le site web qui rend les services accessibles.

« Modèles » désigne les grands modèles de langages (LLM) réutilisés dans le cadre de leur licence d’utilisation par la plateforme pour répondre à ses finalités.

« Services » désigne les fonctionnalités offertes par la plateforme pour répondre à ses finalités.

3. Description de la plateforme

Édité par le Service du numérique du Ministère de la Culture, le comparateur est une plateforme de comparaison des modèles conversationnels adressée au grand public dans le but (1) de sensibiliser les citoyens aux grands modèles de langage (LLMs), (2) de collecter les préférences des utilisateurs pour constituer des jeux de données d’alignement.

L’utilisateur ou l’utilisatrice pose une question en français et obtient des réponses de deux grands modèles de langages (LLM) anonymes. Il ou elle vote pour le modèle qui fournit la réponse qu’il préfère et se voit alors révélée l’identité des modèles. Ce dispositif de production participative inspiré de la plateforme « chatbot arena » (LMSYS) permet de constituer des jeux de données de préférences humaines sur des tâches réelles, en français, utilisables pour l’alignement des modèles.

Ces jeux de données seront rendus accessibles sous licence ouverte, notamment pour favoriser des usages de recherche.

4. Fonctionnalités

Afin de répondre au double objectif de sensibiliser les citoyens aux grands modèles de langage et collecter les préférences des utilisateurs et utilisatrices, les services rendus par la plateforme sans restriction d’accès sont les suivants :

  • Une interface humain-machine permettant de dialoguer simultanément avec deux modèles conversationnels et de voter pour la réponse préférée.

Les modèles intégrés à la plateforme sont déployés sur les serveurs d’inférence des différents partenaires (Scaleway, OVH, Hugging Face, Google Cloud, Mistral Ai). Les conditions de standardisation d’inférence sont renseignées sur la plateforme pour garantir la transparence d’utilisation des modèles.

  • Une interface de comparaison des modèles.

À l’issue du parcours de vote, l’utilisateur peut consulter la liste des modèles intégrés au comparateur et accéder à une liste d’informations sur ces modèles. Les informations documentant les modèles sont sourcées.

  • Partage et mise à disposition des jeux de données issus de la collecte des préférences des utilisateurs.

Le service recueille les données de dialogue et de préférence des utilisateurs. Les jeux de données partagés comprendront les questions de l’utilisateur, les réponses des deux modèles, le vote et les préférences de l’utilisateur.

L’éditeur se réserve le droit de distribuer sous licence ouverte 2.0 les données de dialogue et de préférence de l’utilisateur. Le jeu de données est diffusé sur la plateforme Hugging Face à travers le compte du ministère de la culture (https://huggingface.co/ministere-culture).

5. Responsabilités

L’utilisateur est responsable des données ou contenus qu'il ou elle saisit dans l’invite offert par la plateforme.

La plateforme n’a pas vocation à être utilisée pour générer des contenus illicites ou contraires à l’ordre public et plus généralement toute génération contrevenant au cadre juridique en vigueur.

A cet égard, l’utilisateur ne saisit pas dans l’invite des contenus ou informations contraires aux dispositions légales et réglementaires en vigueur.

Les données saisies par l’utilisateur sur la plateforme ayant vocation à être mis à disposition, il ou elle s’engage à ne pas transmettre d’informations permettant de l’identifier ou d’identifier un tiers.

En tout état de cause, l’éditeur s’engage à mettre en œuvre les moyens permettant de s’assurerde l’anonymisation les données de dialogue avant leur mise à disposition.

De manière générale, l’éditeur se dégage de toute responsabilité en cas d’utilisationnon-conforme aux modalités d’utilisation.

6. Code et licences

Le code source de la plateforme est libre et disponible ici : https://github.com/betagouv/languia

Les LLM utilisés pour alimenter les services sont régis par les licences suivantes :

Modèle d’IA conversationnelleLien vers la notice des modèlesLicence
Apertus 8B Instructhttps://huggingface.co/swiss-ai/Apertus-8B-Instruct-2509Apache 2.0
Aya Expanse 32Bhttps://huggingface.co/CohereForAI/aya-expanse-32bCC-BY-NC-4.0
Claude 4.5 Sonnethttps://www.anthropic.com/news/claude-sonnet-4-5proprietary
Claude 4 SonnetNon disponibleproprietary
Command Ahttps://huggingface.co/CohereForAI/c4ai-command-a-03-2025CC-BY-NC-4.0
DeepSeek v3.1https://huggingface.co/deepseek-ai/DeepSeek-V3.1MIT
DeepSeek R1 0528https://huggingface.co/deepseek-ai/DeepSeek-R1-0528MIT
DeepSeek R1 Llama 70Bhttps://huggingface.co/deepseek-ai/deepseek-r1-distill-llama-70bLlama 3.3
Gemini 2.5 FlashNon disponibleproprietary
Gemma 3 12Bhttps://huggingface.co/google/gemma-3-12b-itGemma
Gemma 3 27Bhttps://huggingface.co/google/gemma-3-27b-itGemma
Gemma 3 4Bhttps://huggingface.co/google/gemma-3-4b-itGemma
Gemma 3n 4BNon disponibleGemma
GLM 4.5Non disponibleMIT
GLM 4.6Non disponibleMIT
GPT-4.1 Minihttps://platform.openai.com/docs/models/gpt-4.1-miniproprietary
GPT 4.1 Nanohttps://openai.com/index/gpt-4-1/proprietary
GPT 5Non disponibleproprietary
GPT 5 Minihttps://platform.openai.com/docs/models/gpt-5-miniproprietary
GPT 5 Nanohttps://platform.openai.com/docs/models/gpt-5-nanoproprietary
GPT OSS-120BNon disponibleApache 2.0
GPT OSS-20BNon disponibleApache 2.0
Grok 4 Fasthttps://x.ai/news/grok-4-fastproprietary
Hermes 4 70BNon disponibleLlama 3.1
Kimi K2https://huggingface.co/moonshotai/Kimi-K2-InstructMIT
Llama 3.1 8Bhttps://huggingface.co/meta-llama/Meta-Llama-3.1-8B-InstructLlama 3.1
Llama 3.3 70Bhttps://huggingface.co/meta-llama/Llama-3.3-70B-InstructLlama 3.3
Llama 4 Scouthttps://huggingface.co/meta-llama/Llama-4-Scout-17B-16E-InstructLlama 4
Llama 4 MaverickNon disponibleLlama 4
Magistral MediumNon disponibleproprietary
Magistral SmallNon disponibleApache 2.0
Mistral Medium 2508https://mistral.ai/news/mistral-medium-3proprietary
Mistral Medium 3.1Non disponibleproprietary
Mistral Sabahttps://mistral.ai/news/mistral-sabaproprietary
Mistral Small 3.2Non disponibleApache 2.0
o4 minihttps://platform.openai.com/docs/models/o4-miniproprietary
Phi-4https://huggingface.co/microsoft/Phi-4MIT
Qwen 3 8Bhttps://huggingface.co/Qwen/Qwen3-8B-AWQApache 2.0
Qwen 3 30B A3BNon disponibleApache 2.0
Qwen 3 32Bhttps://huggingface.co/Qwen/Qwen3-32BApache 2.0
Qwen3 Coder 480B A35Bhttps://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-InstructApache 2.0
Qwen 3 Maxhttps://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-listproprietary

La liste des modèles de langage intégrés à la plateforme est susceptible d’évoluer au cours du temps et est mise à jour à chaque modification.

7. Disponibilité des services

La plateforme est accessible, sauf cas de force majeure ou d’évènement hors de contrôle de son éditeur.

L’éditeur se réserve le droit de suspendre, d'interrompre ou de limiter, sans avis préalable, l'accès à tout ou partie des services, notamment pour des opérations de maintenance et de mises à jour nécessaires au bon fonctionnement du service et des matériels afférents, ou pour toute autre raison, notamment technique.

Il n’est pas garanti que le service soit exempt d’anomalies ou erreurs. Le service est donc mis à disposition sans garantie sur sa disponibilité et ses performances.

A ce titre, l’éditeur ne saurait être tenu responsable des pertes ou préjudices, de quelque nature qu’ils soient, qui pourraient être causés à la suite d’un dysfonctionnement ou une indisponibilité du service. De telles situations n'ouvriront droit à aucune compensation financière.

8. Évolution des modalités d'utilisation

Les modalités d’utilisation peuvent être modifiées ou complétées à tout moment, sans préavis, en fonction des modifications apportées aux services, de l’évolution de la législation ou pour tout autre motif jugé nécessaire.

Ces modifications et mises à jour s’imposent à l’utilisateur ou l’utilisatrice qui doit, en conséquence, se référer régulièrement à cette rubrique pour vérifier les modalités générales en vigueur.

9. Contact

Pour toute question sur le service, vous pouvez écrire à contact@comparia.beta.gouv.fr.