Cours 10/11Donnees publiques

Open Data

Decouvre l'Open Data : des donnees publiques librement accessibles qui permettent de creer des applications, faire de la recherche et ameliorer la transparence.

20 minNiveau Facile60 XP
1

Qu'est-ce que l'Open Data ?

L'Open Data (donnees ouvertes) designe des donnees numeriques accessibles a tous, gratuitement, dans des formats ouverts et reutilisables.

Les 3 piliers de l'Open Data

Accessible

Telechargeable gratuitement par tous

Format ouvert

CSV, JSON, XML... lisibles par tous les outils

Reutilisable

Libre de droits, exploitable commercialement

Pourquoi "ouvert" ? Contrairement aux donnees propriétaires (ex: bases clients d'entreprises), l'Open Data est libre de restrictions : tu peux la telecharger, l'analyser, la modifier et la redistribuer.

2

Exemples de donnees ouvertes

Transports

Horaires bus/metro, trafic routier, velos en libre-service

Source : SNCF, RATP, Velib

Education

Resultats du bac, statistiques scolaires, carte des etablissements

Source : data.education.gouv.fr

Demographie

Population par commune, naissances, deces, mariages

Source : INSEE

Environnement

Qualite de l'air, meteo, consommation energetique

Source : Meteo France, ADEME

Economie

PIB, chomage, creations d'entreprises, impots

Source : INSEE, DGFiP

Sante

Hopitaux, pharmacies, epidemies, vaccination

Source : Sante publique France
3

Ou trouver des donnees ouvertes ?

🇫🇷

data.gouv.fr

Portail officiel francais - 40 000+ jeux de donnees

🇪🇺

data.europa.eu

Portail europeen - Donnees de tous les pays UE

📊

INSEE

Statistiques francaises - Population, economie, societe

🌍

World Bank Open Data

Donnees mondiales - Developpement, economie

4

Exploiter l'Open Data en Python

Telecharger et analyser des donnees

import requests
import csv
from io import StringIO

# Telecharger un fichier CSV depuis data.gouv.fr
url = "https://www.data.gouv.fr/fr/datasets/r/xxx"
response = requests.get(url)

# Lire le CSV
donnees = csv.DictReader(StringIO(response.text))

# Parcourir les enregistrements
for ligne in donnees:
    print(ligne)

Exemple : Analyser les prenoms en France

# Donnees des prenoms (data.gouv.fr)
prenoms = [
    {"prenom": "Emma", "sexe": "F", "annee": 2023, "nombre": 3421},
    {"prenom": "Gabriel", "sexe": "M", "annee": 2023, "nombre": 3198},
    {"prenom": "Jade", "sexe": "F", "annee": 2023, "nombre": 2987},
]

# Top prenoms feminins
feminins = [p for p in prenoms if p["sexe"] == "F"]
top_f = sorted(feminins, key=lambda x: x["nombre"], reverse=True)
print("Top prenom feminin 2023 :", top_f[0]["prenom"])
# Resultat : Emma
5

Enjeux de l'Open Data

Avantages

  • Transparence democratique
  • Innovation (apps, startups)
  • Recherche scientifique facilitee
  • Services publics ameliores
  • Lutte contre la corruption

Defis

  • Qualite inegale des donnees
  • Mises a jour parfois rares
  • Formats non standardises
  • Competences techniques requises
  • Risque de reidentification

Quiz de validation

Question 1: Qu'est-ce que l'Open Data ?

Question 2: Quel est le principal portail d'Open Data du gouvernement francais ?

Question 3: Quelle organisation peut publier des donnees en Open Data ?

Question 4: Quel format est generalement utilise pour les donnees Open Data tabulaires ?

Question 5: Quel est un exemple d'utilisation de l'Open Data ?

A retenir

  • Open Data = donnees publiques, gratuites, en format ouvert.
  • Portail francais : data.gouv.fr (40 000+ jeux de donnees).
  • Favorise la transparence, l'innovation et la recherche.
  • Formats standards : CSV, JSON, exploitables en Python.

Dans ce cours


Progression du theme

10/11 cours completes

Pixel