Section 1 - Informations à fournir par tous les fournisseurs de modèles d'IA à usage général
La documentation technique visée à l'article 53, paragraphe 1, point a), contient au moins les informations suivantes, en fonction de la taille et du profil de risque du modèle :
1. Une description générale du modèle d'IA à usage général, y compris :
(a) les tâches que le modèle est censé accomplir et le type et la nature des systèmes d'intelligence artificielle dans lesquels il peut être intégré ;
(b) les politiques d'utilisation acceptable applicables ;
(c) la date de diffusion et les méthodes de distribution ;
(d) l'architecture et le nombre de paramètres ;
(e) la modalité (par exemple, texte, image) et le format des entrées et des sorties ;
(f) la licence.
2. Une description détaillée des éléments du modèle visé au point 1 et des informations pertinentes sur le processus d'élaboration, y compris les éléments suivants :
(a) les moyens techniques (par exemple, les instructions d'utilisation, l'infrastructure, les outils) nécessaires à l'intégration du modèle d'IA à usage général dans les systèmes d'IA ;
(b) les spécifications de conception du modèle et du processus de formation, y compris les méthodologies et les techniques de formation, les principaux choix de conception, y compris leur justification et les hypothèses formulées ; ce que le modèle est censé optimiser et la pertinence des différents paramètres, le cas échéant ;
(c) des informations sur les données utilisées pour la formation, les essais et la validation, le cas échéant, y compris le type et la provenance des données et les méthodes de conservation (par exemple, nettoyage, filtrage, etc.), le nombre de points de données, leur portée et leurs principales caractéristiques ; la manière dont les données ont été obtenues et sélectionnées, ainsi que toutes les autres mesures visant à détecter l'inadéquation des sources de données et les méthodes de détection des biais identifiables, le cas échéant ;
(d) les ressources informatiques utilisées pour former le modèle (par exemple, le nombre d'opérations en virgule flottante), le temps de formation et d'autres détails pertinents liés à la formation ;
(e) la consommation d'énergie connue ou estimée du modèle. En ce qui concerne le point e), lorsque la consommation d'énergie du modèle est inconnue, la consommation d'énergie peut être basée sur des informations relatives aux ressources informatiques utilisées.
Section 2 - Informations supplémentaires à fournir par les fournisseurs de modèles d'IA à usage général présentant un risque systémique
1. Une description détaillée des stratégies d'évaluation, y compris les résultats de l'évaluation, sur la base des protocoles et outils d'évaluation publics disponibles ou d'autres méthodologies d'évaluation. Les stratégies d'évaluation comprennent les critères d'évaluation, les mesures et la méthode d'identification des limites.
2. Le cas échéant, une description détaillée des mesures mises en place pour effectuer des tests contradictoires internes et/ou externes (par exemple, red teaming), des adaptations de modèles, y compris l'alignement et la mise au point.
3. Le cas échéant, une description détaillée de l'architecture du système expliquant comment les composants logiciels se construisent ou s'alimentent les uns les autres et s'intègrent dans le traitement global.