Open Data
Decouvre l'Open Data : des donnees publiques librement accessibles qui permettent de creer des applications, faire de la recherche et ameliorer la transparence.
Qu'est-ce que l'Open Data ?
L'Open Data (donnees ouvertes) designe des donnees numeriques accessibles a tous, gratuitement, dans des formats ouverts et reutilisables.
Les 3 piliers de l'Open Data
Accessible
Telechargeable gratuitement par tous
Format ouvert
CSV, JSON, XML... lisibles par tous les outils
Reutilisable
Libre de droits, exploitable commercialement
Pourquoi "ouvert" ? Contrairement aux donnees propriétaires (ex: bases clients d'entreprises), l'Open Data est libre de restrictions : tu peux la telecharger, l'analyser, la modifier et la redistribuer.
Exemples de donnees ouvertes
Transports
Horaires bus/metro, trafic routier, velos en libre-service
Source : SNCF, RATP, VelibEducation
Resultats du bac, statistiques scolaires, carte des etablissements
Source : data.education.gouv.frDemographie
Population par commune, naissances, deces, mariages
Source : INSEEEnvironnement
Qualite de l'air, meteo, consommation energetique
Source : Meteo France, ADEMEEconomie
PIB, chomage, creations d'entreprises, impots
Source : INSEE, DGFiPSante
Hopitaux, pharmacies, epidemies, vaccination
Source : Sante publique FranceOu trouver des donnees ouvertes ?
data.gouv.fr
Portail officiel francais - 40 000+ jeux de donnees
data.europa.eu
Portail europeen - Donnees de tous les pays UE
INSEE
Statistiques francaises - Population, economie, societe
World Bank Open Data
Donnees mondiales - Developpement, economie
Exploiter l'Open Data en Python
Telecharger et analyser des donnees
import requests
import csv
from io import StringIO
# Telecharger un fichier CSV depuis data.gouv.fr
url = "https://www.data.gouv.fr/fr/datasets/r/xxx"
response = requests.get(url)
# Lire le CSV
donnees = csv.DictReader(StringIO(response.text))
# Parcourir les enregistrements
for ligne in donnees:
print(ligne)Exemple : Analyser les prenoms en France
# Donnees des prenoms (data.gouv.fr)
prenoms = [
{"prenom": "Emma", "sexe": "F", "annee": 2023, "nombre": 3421},
{"prenom": "Gabriel", "sexe": "M", "annee": 2023, "nombre": 3198},
{"prenom": "Jade", "sexe": "F", "annee": 2023, "nombre": 2987},
]
# Top prenoms feminins
feminins = [p for p in prenoms if p["sexe"] == "F"]
top_f = sorted(feminins, key=lambda x: x["nombre"], reverse=True)
print("Top prenom feminin 2023 :", top_f[0]["prenom"])
# Resultat : EmmaEnjeux de l'Open Data
Avantages
- Transparence democratique
- Innovation (apps, startups)
- Recherche scientifique facilitee
- Services publics ameliores
- Lutte contre la corruption
Defis
- Qualite inegale des donnees
- Mises a jour parfois rares
- Formats non standardises
- Competences techniques requises
- Risque de reidentification
Quiz de validation
Question 1: Qu'est-ce que l'Open Data ?
Question 2: Quel est le principal portail d'Open Data du gouvernement francais ?
Question 3: Quelle organisation peut publier des donnees en Open Data ?
Question 4: Quel format est generalement utilise pour les donnees Open Data tabulaires ?
Question 5: Quel est un exemple d'utilisation de l'Open Data ?
A retenir
- ✓Open Data = donnees publiques, gratuites, en format ouvert.
- ✓Portail francais : data.gouv.fr (40 000+ jeux de donnees).
- ✓Favorise la transparence, l'innovation et la recherche.
- ✓Formats standards : CSV, JSON, exploitables en Python.
