Glossaire bilingue — Sobr.ia
Glossaire bilingue — Sobr.ia
Version : 0.1 (seed) — à enrichir en S0 (cible ≥ 40 termes). Langues : FR + EN. Convention : ordre alphabétique sur le terme FR.
| Terme FR | Terme EN | Définition courte | Source |
|---|---|---|---|
| Amortissement (embodied) | Embodied amortization | Répartition de l’impact de fabrication du hardware sur sa durée d’usage et son volume de requêtes. | Gupta et al. 2022 |
| CO₂ équivalent (CO₂eq) | Carbon dioxide equivalent | Métrique unifiée des gaz à effet de serre, pondérés par leur GWP100. | GIEC |
| CSRD | Corporate Sustainability Reporting Directive | Directive UE imposant la publication de données extra-financières pour les grandes entreprises. | UE 2022/2464 |
| Datacenter | Data centre | Installation hébergeant les serveurs où l’inférence LLM s’exécute. | — |
| DCO | Developer Certificate of Origin | Certification simple par signature de commit, alternative à un CLA. | https://developercertificate.org |
| DVC | Data Version Control | Outil de versionnage des datasets massifs, pendant de Git pour la data. | dvc.org |
| EcoLogits | EcoLogits | Bibliothèque Python d’estimation d’impact des requêtes LLMs, méthodologie officielle ComparIA. | Data for Good |
| Embodied carbon | Embodied carbon | Émissions liées à la fabrication, transport et fin de vie du matériel. | ITU-T L.1410 |
| Facteur d’émission (IF) | Emission Factor | Quantité de gCO₂eq par unité d’énergie consommée (gCO₂eq/kWh). | ADEME Base Empreinte |
| Frugalité numérique | Digital frugality | Démarche de conception minimisant la consommation de ressources des systèmes numériques. | AFNOR SPEC 2314 |
| GHG Protocol | GHG Protocol | Standard international de comptabilité des émissions de gaz à effet de serre. | ghgprotocol.org |
| GPU | GPU | Processeur graphique utilisé pour l’inférence et l’entraînement des LLMs. | — |
| IRIS | IRIS (statistical unit) | Plus petite unité géographique INSEE en France, ~2 000 habitants. | INSEE |
| LCA (ACV) | Life Cycle Assessment | Analyse environnementale couvrant le cycle de vie complet d’un produit ou service. | ISO 14040/44 |
| Lineage | Lineage | Traçabilité des transformations d’une donnée depuis son origine. | — |
| LLM | Large Language Model | Modèle de langage de grande taille (GPT, Claude, Mistral…). | — |
| Manifest V3 (MV3) | Manifest V3 | Format moderne des extensions WebExtension (Chrome 88+, Firefox 109+). | developer.mozilla.org |
| Médaillon (architecture) | Medallion architecture | Pattern de pipeline data en 3 couches Copper/Silver/Gold. | Databricks 2020 |
| Monte-Carlo | Monte Carlo simulation | Méthode statistique de propagation d’incertitude par échantillonnage. | — |
| PUE | Power Usage Effectiveness | Ratio énergie totale datacenter / énergie IT, mesure d’efficacité énergétique. | The Green Grid |
| RGAA | French web accessibility standard | Référentiel français d’accessibilité, niveau AA équivalent WCAG 2.1 AA. | DINUM |
| Scope 1/2/3 | Scope 1/2/3 | Périmètres d’émissions définis par le GHG Protocol. | GHG Protocol |
| Token | Token | Unité de découpage de texte utilisée par les LLMs (≈ 4 caractères en moyenne). | — |
| WUE | Water Usage Effectiveness | Litres d’eau consommés par kWh IT d’un datacenter. | The Green Grid |
Termes à ajouter en S0 (liste de travail) :
- AI Act, Bilan Carbone®, Compte de résultat environnemental, EROI, Greenwashing, Inférence vs entraînement, Jevons paradox, MLOps, Mix électrique, Modèle dense vs sparse, Quantization, Sparsity, TPU, Tokenizer, Datasheet (Gebru), Distillation, FLOPS / TFLOPS, Latence, Throughput, etc.