Exemple de CV

Ingénieur données
CV

Créez un CV d’ingénieur données avec vos pipelines ETL, outils de data warehouse et métriques de fiabilité. Conseils pour Spark, Airflow et dbt.

Créer mon CV de ingénieur données

Ingénieure données senior avec 6 ans d’expérience dans la construction et l’exploitation de pipelines de données, d’entrepôts et de systèmes de streaming temps réel. A conçu une plateforme data traitant 5 To par jour pour plus de 200 analystes internes. Forte expertise en Spark, dbt, Airflow et Snowflake.

Experience

Ingénieure données senior · Carrefour
2022-07 – Present

Pilote l’équipe de plateforme data construisant des pipelines batch et streaming pour l’organisation analytique de la supply chain.

  • Conçu une plateforme data traitant 5 To par jour depuis plus de 40 systèmes sources, au service de plus de 200 analystes et data scientists
  • Construit un pipeline de suivi d’inventaire en temps réel (Kafka + Flink) réduisant la fraîcheur des données de 24 heures à moins de 5 minutes
  • Migré l’entrepôt de données de Teradata on-premise vers Snowflake, réduisant les coûts de requête de 55 % et améliorant la performance moyenne des requêtes de 3x
  • Établi les standards de modélisation dbt et un pipeline CI/CD pour les transformations de données, adoptés par 6 équipes analytiques
SparkKafkaFlinkSnowflakedbtAirflowPython
Ingénieure données · Capgemini
2020-03 – 2022-06

A livré des solutions d’ingénierie data pour des clients grands comptes dans la distribution, la finance et la santé.

  • Construit un pipeline de données de bout en bout pour un retailer de 4 Md€, consolidant 12 sources de données dans un entrepôt analytique unifié
  • Implémenté des contrôles qualité avec Great Expectations, détectant 95 % des problèmes de données avant leur arrivée dans les tableaux de bord
  • Conçu un modèle de données dimensionnel supportant plus de 200 M€ d’attribution de dépenses marketing
PythondbtBigQueryAirflowFivetranLooker
Ingénieure données junior · Atos
2018-08 – 2020-02

A construit des pipelines ETL pour le traitement des sinistres et l’analytique santé.

  • Développé des pipelines ETL traitant plus de 2 M de sinistres d’assurance par jour avec une intégrité des données de 99,9 %
  • Automatisé les workflows de validation des données, réduisant le temps de QA manuel de 70 %
PythonSQLSparkHadoopHiveAWS

Education

INSA LyonDiplôme d’ingénieur, Informatique · GPA 3.6 GPA
2014-09 – 2018-05

Skills

Traitement des donnéesSpark, Kafka, Flink, Airflow, dbt, Fivetran, Dagster
Entrepôts de donnéesSnowflake, BigQuery, Redshift, Databricks, Delta Lake
LangagesPython, SQL, Scala, Java, Bash
Plateformes et outilsAWS (S3, EMR, Glue, Lambda), GCP, Docker, Terraform, Git, Great Expectations

Certificates

Databricks Certified Data Engineer Associate · Databricks2023-04
AWS Certified Data Engineer – Associate · Amazon Web Services2023-09
dbt Analytics Engineering Certification · dbt Labs2022-11

Créé avec le modèle modern - utiliser ce modèle

Ce que les recruteurs en data engineering recherchent

Les responsables du recrutement évaluent les ingénieurs données sur leur capacité à construire et maintenir des pipelines de données fiables, performants et scalables. Ils recherchent la maîtrise des outils de pipeline (Airflow, Spark, dbt), les compétences en data warehousing (Snowflake, BigQuery, Redshift) et l’expérience avec les données à grande échelle.

Le signal le plus fort est un pipeline en production avec des métriques de fiabilité : « A construit un pipeline Spark traitant 5 To/jour avec un uptime de 99,9 % et un SLA de fraîcheur de 15 minutes ». Les recruteurs veulent voir que vos pipelines fonctionnent de manière fiable, pas seulement qu’ils existent.

La qualité des données est une compétence de plus en plus valorisée. Les ingénieurs données qui implémentent des tests de qualité, du monitoring et des alertes sur la fraîcheur et l’intégrité des données sont très recherchés.

Guide de rédaction du CV

Résumé professionnel

Mentionnez votre titre, vos années d’expérience, vos outils principaux et votre résultat le plus significatif.

Exemple : « Ingénieur données senior avec 6 ans d’expérience en construction de pipelines de données à grande échelle. A architecturé un data lakehouse sur Snowflake et Spark traitant 8 To/jour pour une plateforme e-commerce de 20 M d’utilisateurs. »

Expérience professionnelle

Décrivez les pipelines construits, les volumes de données traités, la fiabilité atteinte et les améliorations de productivité pour les équipes data.

Faible : « A construit des pipelines de données. »

Fort : « A conçu un pipeline ETL avec Airflow et Spark, ingérant 3 To/jour depuis 15 sources vers Snowflake, avec un uptime de 99,95 % et un SLA de fraîcheur de 10 minutes. »

Compétences techniques

Organisez en Pipelines, Stockage, Langages et Infrastructure. Soyez spécifique sur les versions et configurations.

Compétences à mettre en avant

Compétences techniques : Python, SQL, Scala, Apache Spark, Apache Airflow, dbt, Apache Kafka, Flink, Snowflake, BigQuery, Redshift, Delta Lake, Iceberg, AWS (S3, Glue, EMR, Redshift), GCP (BigQuery, Dataflow, Pub/Sub), Docker, Kubernetes, Terraform, Git, tests de qualité des données, Great Expectations, data lineage

Compétences transversales : collaboration avec les data scientists et analystes, documentation des modèles de données, communication des SLA, résolution de problèmes de performance, mentorat technique

Conseils pour le CV

  1. Quantifiez les volumes de données. « 5 To/jour », « 100 M de lignes », « 15 sources » — l’échelle est le premier indicateur de la complexité de votre travail.
  1. Incluez les métriques de fiabilité. Uptime, SLA de fraîcheur, taux d’échec des jobs — ces métriques prouvent que vos pipelines fonctionnent en production.
  1. Mentionnez les outils spécifiques. Airflow, Spark, dbt, Snowflake, Kafka — les recruteurs filtrent par outil. Ne soyez pas générique.
  1. Montrez l’impact sur les utilisateurs en aval. « A réduit le temps de rafraîchissement des tableaux de bord de 4 heures à 15 minutes pour l’équipe analytics » relie votre travail à l’impact business.
  1. Incluez la qualité des données. Tests, monitoring, alertes, data lineage — la qualité des données est devenue un critère différenciant.
  1. Restez sur une à deux pages. La concision est appréciée même pour les profils seniors.

Erreurs courantes

  • Pas de métriques de volume ou de fiabilité : les pipelines de données sont évalués sur leur échelle et leur fiabilité. L’absence de ces chiffres est un handicap.
  • Confusion avec analyste de données : si votre CV se concentre sur les dashboards et les analyses, vous apparaissez comme un analyste, pas un ingénieur données.
  • Outils génériques : « ETL » seul ne suffit pas. Nommez Airflow, Spark, dbt et les plateformes cloud spécifiques.
  • Ignorer la qualité des données : les pipelines sans tests de qualité sont des bombes à retardement. Montrez que vous gérez la qualité proactivement.

Questions fréquemment posées

Data engineer vs data scientist : quelle différence ?

Les ingénieurs données construisent l’infrastructure (pipelines, data warehouses). Les data scientists analysent les données et créent des modèles. Les deux sont complémentaires.

Faut-il connaître Scala ?

Scala est très utile pour Spark, mais Python est le langage dominant en data engineering. Si vous connaissez les deux, c’est un avantage.

dbt est-il incontournable ?

dbt est devenu un standard pour la transformation des données dans les data warehouses modernes. L’expérience avec dbt est un avantage significatif pour les postes dans les entreprises qui utilisent Snowflake ou BigQuery.

Prêt à créer votre CV de ingénieur données ?

Choisissez un modèle, ajoutez vos informations et téléchargez un CV soigné en quelques minutes.

Commencer gratuitement