Design4Green 2025 — « Résumer mieux avec moins »
Dans le cadre du challenge international Design4Green 2025, mon équipe (groupe 13) a conçu une application d’intelligence artificielle éco-conçue : une API de résumé de texte capable de générer automatiquement des synthèses de 10 à 15 mots tout en réduisant l’empreinte énergétique et les ressources CPU/RAM utilisées.
Nous avons développé une API Flask connectée à un modèle léger de 70 millions de paramètres (EleutherAI/pythia-70m-deduped). L’application proposait deux modes de fonctionnement : un mode baseline en précision FP32 et un mode optimisé reposant sur une quantization INT8 dynamique. Cette approche a permis d’alléger considérablement la taille du modèle et d’accélérer l’inférence sans dégrader la qualité des résumés.
Le pipeline de génération comportait une normalisation Unicode, une étape de prompt engineering bilingue (anglais/français) et une génération déterministe calibrée (greedy decoding, pénalisation des répétitions, blocage des trigrammes). Ces choix ont permis d’atteindre un taux de conformité de 97,5 % à la contrainte de longueur (10-15 mots), bien au-delà du seuil exigé de 95 %:contentReference[oaicite:2]{index=2}.
Chaque requête à l’API était instrumentée pour mesurer trois indicateurs : l’énergie consommée (Wh, mesurée par CodeCarbon), la latence (ms) et la mémoire utilisée (MiB). Les résultats obtenus sur processeur Intel i5 montrent une réduction énergétique de 37,8 %, une diminution de 38,6 % du temps de réponse et une baisse de 40,4 % de l’usage mémoire en mode optimisé INT8 par rapport à la baseline FP32:contentReference[oaicite:3]{index=3}.
En complément, nous avons conçu une interface web sobre et accessible respectant les normes RGAA : palette restreinte, absence de dépendances lourdes, navigation clavier complète et temps de chargement inférieur à 500 ms. L’interface permettait de saisir un texte, de sélectionner le mode souhaité et d’afficher instantanément le résumé ainsi que les métriques d’énergie, latence et mémoire.
Ce projet m’a permis d’approfondir mes compétences en développement Flask, en optimisation CPU et en éco-conception logicielle. J’ai également acquis une expérience concrète de la mesure d’impact énergétique et de la reproductibilité scientifique dans un contexte d’IA générative.
📄 Rapport de projet (PDF)
💻 Code source complet