Glossaire bilingue — Sobr.ia

Glossaire bilingue — Sobr.ia

Version : 0.1 (seed) — à enrichir en S0 (cible ≥ 40 termes). Langues : FR + EN. Convention : ordre alphabétique sur le terme FR.


Terme FRTerme ENDéfinition courteSource
Amortissement (embodied)Embodied amortizationRépartition de l’impact de fabrication du hardware sur sa durée d’usage et son volume de requêtes.Gupta et al. 2022
CO₂ équivalent (CO₂eq)Carbon dioxide equivalentMétrique unifiée des gaz à effet de serre, pondérés par leur GWP100.GIEC
CSRDCorporate Sustainability Reporting DirectiveDirective UE imposant la publication de données extra-financières pour les grandes entreprises.UE 2022/2464
DatacenterData centreInstallation hébergeant les serveurs où l’inférence LLM s’exécute.
DCODeveloper Certificate of OriginCertification simple par signature de commit, alternative à un CLA.https://developercertificate.org
DVCData Version ControlOutil de versionnage des datasets massifs, pendant de Git pour la data.dvc.org
EcoLogitsEcoLogitsBibliothèque Python d’estimation d’impact des requêtes LLMs, méthodologie officielle ComparIA.Data for Good
Embodied carbonEmbodied carbonÉmissions liées à la fabrication, transport et fin de vie du matériel.ITU-T L.1410
Facteur d’émission (IF)Emission FactorQuantité de gCO₂eq par unité d’énergie consommée (gCO₂eq/kWh).ADEME Base Empreinte
Frugalité numériqueDigital frugalityDémarche de conception minimisant la consommation de ressources des systèmes numériques.AFNOR SPEC 2314
GHG ProtocolGHG ProtocolStandard international de comptabilité des émissions de gaz à effet de serre.ghgprotocol.org
GPUGPUProcesseur graphique utilisé pour l’inférence et l’entraînement des LLMs.
IRISIRIS (statistical unit)Plus petite unité géographique INSEE en France, ~2 000 habitants.INSEE
LCA (ACV)Life Cycle AssessmentAnalyse environnementale couvrant le cycle de vie complet d’un produit ou service.ISO 14040/44
LineageLineageTraçabilité des transformations d’une donnée depuis son origine.
LLMLarge Language ModelModèle de langage de grande taille (GPT, Claude, Mistral…).
Manifest V3 (MV3)Manifest V3Format moderne des extensions WebExtension (Chrome 88+, Firefox 109+).developer.mozilla.org
Médaillon (architecture)Medallion architecturePattern de pipeline data en 3 couches Copper/Silver/Gold.Databricks 2020
Monte-CarloMonte Carlo simulationMéthode statistique de propagation d’incertitude par échantillonnage.
PUEPower Usage EffectivenessRatio énergie totale datacenter / énergie IT, mesure d’efficacité énergétique.The Green Grid
RGAAFrench web accessibility standardRéférentiel français d’accessibilité, niveau AA équivalent WCAG 2.1 AA.DINUM
Scope 1/2/3Scope 1/2/3Périmètres d’émissions définis par le GHG Protocol.GHG Protocol
TokenTokenUnité de découpage de texte utilisée par les LLMs (≈ 4 caractères en moyenne).
WUEWater Usage EffectivenessLitres d’eau consommés par kWh IT d’un datacenter.The Green Grid

Termes à ajouter en S0 (liste de travail) :

  • AI Act, Bilan Carbone®, Compte de résultat environnemental, EROI, Greenwashing, Inférence vs entraînement, Jevons paradox, MLOps, Mix électrique, Modèle dense vs sparse, Quantization, Sparsity, TPU, Tokenizer, Datasheet (Gebru), Distillation, FLOPS / TFLOPS, Latence, Throughput, etc.