# 🔁 Reproduction des Métriques AI ROI Dataset v1.0

**Auteur** : Denis ATLAN (ENDKOO)  
**Date** : 30 décembre 2025  
**Version** : 1.0

---

## 🎯 Objectif

Ce script reproduit **les métriques affichées sur [denisatlan.fr](https://www.denisatlan.fr)** à partir du dataset AI ROI :

- ✅ ROI médian 12 mois : **127,3%**
- ✅ ROI médian 24 mois : **159,8%**
- ✅ Taux de succès : **82,5%**
- ✅ Déploiements totaux : **200**

Le script **valide automatiquement** que les métriques calculées correspondent aux valeurs officielles dans `/evidence/metrics.json`.

---

## 📦 Installation

### Prérequis

- Python 3.9+
- pandas

### Installation pandas

```bash
pip install pandas
```

---

## 📥 Téléchargement du Dataset

Le script nécessite le fichier `ai_roi_dataset_200_deployments.csv` dans le dossier parent.

**Option 1 : Télécharger depuis Hugging Face**
```bash
cd ../  # Remonter au dossier ai-roi/
wget https://huggingface.co/datasets/ENDKOO/ai-roi-b2b-france-200-deployments/resolve/main/ai_roi_dataset_200_deployments.csv
```

**Option 2 : Télécharger depuis Zenodo**
```bash
cd ../
wget https://zenodo.org/records/17795133/files/ai_roi_dataset_200_deployments.csv
```

---

## 🚀 Exécution

```bash
python recompute_metrics.py
```

---

## ✅ Output Attendu

```
============================================================
AI ROI DATASET v1.0 - REPRODUCTION MÉTRIQUES
============================================================

📂 Chargement dataset: ai_roi_dataset_200_deployments.csv
   Lignes chargées: 200

🔢 CALCUL DES MÉTRIQUES:
------------------------------------------------------------
   ROI médian 12 mois:  127.3%
   ROI médian 24 mois:  159.8%
   Taux de succès:      82.5%
   Déploiements totaux: 200

✅ VALIDATION vs metrics.json officiels:
------------------------------------------------------------
   Valeur officielle ROI 24m:      159.8%
   Valeur calculée ROI 24m:        159.8%
   Valeur officielle succès:       82.5%
   Valeur calculée succès:         82.5%
   Valeur officielle déploiements: 200
   Valeur calculée déploiements:   200

✅ VALIDATION OK : Toutes les métriques reproduisent metrics.json

============================================================
✅ SUCCÈS : Les chiffres affichés sur denisatlan.fr sont reproductibles
============================================================
```

---

## ❌ Gestion des Erreurs

### Dataset introuvable

```
❌ ERREUR: Dataset introuvable à .../ai_roi_dataset_200_deployments.csv

📥 Télécharger le dataset:
   https://huggingface.co/datasets/ENDKOO/ai-roi-b2b-france-200-deployments
```

**Solution** : Télécharger le dataset (voir section ci-dessus)

---

### Divergence détectée

```
❌ ÉCHEC VALIDATION: ROI 24m (160.2%) différent de metrics.json (159.8%)

============================================================
❌ ATTENTION : Divergence détectée entre dataset et metrics.json
============================================================
```

**Cause possible** :
- Dataset modifié sans mise à jour de `metrics.json`
- Erreur de calcul dans le script

**Solution** :
1. Vérifier l'intégrité du dataset avec SHA256 (voir `/evidence/checksums.sha256`)
2. Contacter via https://www.denisatlan.fr/#contact-form

---

## 🔒 Validation Intégrité

Le dataset doit avoir le SHA256 suivant :

```bash
sha256sum ai_roi_dataset_200_deployments.csv
# Output attendu : [voir /evidence/checksums.sha256]
```

---

## 📧 Support

**Questions** : https://www.denisatlan.fr/#contact-form  
**Dataset** : https://huggingface.co/datasets/ENDKOO/ai-roi-b2b-france-200-deployments  
**Evidence Pack** : https://www.denisatlan.fr/evidence/

---

## 📜 Licence

- **Script** : CC-BY-4.0
- **Dataset** : CC BY 4.0

---

**Dernière mise à jour** : 30 décembre 2025
