Format CSV
Decouvre le format CSV, le format de fichier le plus simple pour stocker des donnees tabulaires. Apprends a le lire, le creer et le manipuler.
Qu'est-ce que le format CSV ?
CSV signifie "Comma-Separated Values" (valeurs separees par des virgules). C'est un format texte simple pour stocker des donnees sous forme de tableau.
Avantages
- Simple et leger (fichier texte)
- Compatible avec tous les tableurs
- Facile a lire par les programmes
- Standard universel
Limites
- Pas de mise en forme (couleurs, gras...)
- Pas de formules de calcul
- Donnees "plates" uniquement
- Problemes avec les virgules dans les donnees
Structure d'un fichier CSV
Exemple de fichier CSV
Ville,Temperature,Humidite,Date Paris,18,65,2025-03-23 Lyon,21,58,2025-03-23 Marseille,24,45,2025-03-23 Bordeaux,19,70,2025-03-23 Lille,14,78,2025-03-23
En-tete (Header)
La premiere ligne contient les noms des colonnes (descripteurs) :Ville,Temperature,Humidite,Date
Enregistrements
Chaque ligne suivante est un enregistrement (une entree de donnees). Ce fichier contient 5 enregistrements.
Separateur
La virgule , separe chaque valeur. En France, on utilise souvent le point-virgule ;.
Vue tableau
Les differents separateurs
Bien que CSV signifie "virgule", d'autres separateurs peuvent etre utilises selon les pays ou les besoins.
Virgule
Standard international. Probleme : confusion avec decimales en France.
Point-virgule
Utilise en France. Excel en francais utilise ce separateur par defaut.
Tabulation
Fichiers .tsv (Tab-Separated Values). Utile si les donnees contiennent des virgules.
Pipe
Utilise quand les donnees peuvent contenir des virgules et des points-virgules.
Attention aux guillemets ! Si une donnee contient le separateur (ex: "Paris, France"), elle doit etre entouree de guillemets : "Paris, France"
Lire un CSV en Python
Python possede un module integre csv pour lire et ecrire des fichiers CSV.
Exemple de lecture
import csv
# Ouvrir le fichier
with open('meteo.csv', 'r') as fichier:
lecteur = csv.reader(fichier)
# Lire l'en-tete
entete = next(lecteur)
print("Colonnes :", entete)
# Lire chaque ligne
for ligne in lecteur:
print(ligne)Resultat
Colonnes : ['Ville', 'Temperature', 'Humidite', 'Date'] ['Paris', '18', '65', '2025-03-23'] ['Lyon', '21', '58', '2025-03-23'] ['Marseille', '24', '45', '2025-03-23'] ...
Ou trouve-t-on des fichiers CSV ?
Export de tableurs
Excel, Google Sheets, LibreOffice peuvent tous exporter en CSV.
Open Data
data.gouv.fr, INSEE, meteo... publient leurs donnees en CSV.
Export de bases de donnees
Les BDD peuvent exporter leurs tables au format CSV.
Data Science
Format standard pour l'echange de donnees entre outils d'analyse.
Astuce : Tu peux creer ton propre CSV dans n'importe quel editeur de texte (Bloc-notes, VS Code...) et l'ouvrir dans Excel ou Google Sheets !
Quiz de validation
Question 1: Que signifie CSV ?
Question 2: Quel est le separateur standard d'un fichier CSV ?
Question 3: Qu'est-ce que l'en-tete (header) d'un fichier CSV ?
Question 4: Quel logiciel peut ouvrir un fichier CSV ?
Question 5: Combien d'enregistrements contient ce CSV ? Nom,Age Alice,15 Bob,16 Carla,15
A retenir
- ✓CSV = Comma-Separated Values = format texte pour donnees tabulaires.
- ✓La premiere ligne contient les descripteurs (noms des colonnes).
- ✓Le separateur peut etre une virgule, un point-virgule ou une tabulation.
- ✓Python peut lire les CSV avec le module
csv.
Dans ce cours
Progression du theme
4/10 cours completes
