Back

Explore every episode of the podcast DataWatch

Dive into the complete episode list for DataWatch. Each episode is cataloged with detailed descriptions, making it easy to find and explore specific topics. Keep track of all episodes from your favorite podcast and never miss a moment of insightful content.

Rows per page:

1–50 of 50

TitlePub. DateDuration
MongoDB 8.0, Python 3.13 et Lakehouse : les annonces phares du moment18 Oct 202400:53:37

☝ Dans cet Ă©pisode, nous parlons de la sortie de la version 3.13.0 de Python, de la mort du Data Warehouse au profit du Data Lake House, de la Preview des Databricks Apps, de la sortie de la version 8.0 de MongoDB et de Data Strategy. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 La sortie de la version 3.13.0 de Python 👉 La mort du Data Warehouse au profit du Data Lake House 👉 La Preview des Databricks Apps 👉 La sortie de la version 8.0 de MongoDB et de Data Strategy 👉 La Data Strategy

Presto, Rust et Data Lineage : les tendances qui transforment la Data Engineering11 Oct 202400:41:55

☝ Dans cet Ă©pisode, nous parlons de l’importance de Presto et de son framework d’optimisation basĂ© sur l’historique, de l’utilisation de Rust dans la Data Engineering, de l’implĂ©mentation du Data Lineage dans les traitements python, de la balance entre achat et crĂ©ation d’outils Data et de la sortie de la version 1.0.0 de dlt. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 Presto et son framework d’optimisation basĂ© sur l’historique 👉 L’utilisation de Rust dans la Data Engineering 👉 L’implĂ©mentation du Data Lineage dans les traitements python 👉 La balance entre achat et crĂ©ation d’outils Data 👉 La sortie de la version 1.0.0 de dlt

Cycle de vie du stockage : pourquoi cela peut transformer vos coûts data ?04 Aug 202400:21:01

☝ Dans cet Ă©pisode, je parle de 5 erreurs en Data Engineering, des bĂ©nĂ©fices Ă©conomiques dans la mise en place d’une politique de cycle de vie du stockage, de Snowflake Horizon, de l’utilisation de la simplicitĂ© pour rĂ©soudre les problĂšmes, et de diffĂ©rentes techniques de Data Modeling. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 5 erreurs en Data Engineering

👉 Les Ă©conomies d’une politique de cycle de vie du stockage

👉 Snowflake Horizon pour une gouvernance unifiĂ©e

👉 L’utilisation de la simplicitĂ© pour rĂ©soudre les problĂšmes

👉 DiffĂ©rentes techniques de Data Modeling

Data Centers, souveraineté et qualité : les défis de la gestion des données27 Jul 202400:16:42

☝ Dans cet Ă©pisode, nous parlons de souverainetĂ© des donnĂ©es, de Exadata Exascale de Oracle, de Data Timeliness, de 3 Ă©tapes pour la mise en place de Data Quality et de la croissance des Data Centers. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. Cette semaine, je serai exceptionnellement seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 La souverainetĂ© des donnĂ©es

👉 Exadata Exascale de Oracle

👉 Data Timeliness

👉 3 Ă©tapes pour la mise en place de Data Quality

👉 La croissance fulgurante des Data Centers

Polars vs PySpark et quand l'OLTP et l'OLAP convergent enfin avec Snowflake !20 Jul 202401:09:38

☝ Dans cet Ă©pisode, nous parlons de Polars vs PySpark, de la crĂ©ation d’une couche sĂ©mantique des donnĂ©es, de conseils pour leader une Ă©quipe data, de la convergence de l’OLTP et de l’OLAP avec Unistore de Snowflake et de l’histoire de la Modern Data Stack.


đŸŽ™ïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.


👉 Axel sur LinkedIn

👉 Bertrand sur LinkedIn


Articles

👉 Polars vs PySpark

👉 Conseils pour leader une Ă©quipe data

👉 Couche sĂ©mantique des donnĂ©es avec dbt

👉 Unistore, la convergence de l’OLTP et de l’OLAP

👉 L’histoire de la Modern Data Stack

Julien Hurault sur les Slowly Changing Dimensions et les Snowflake Native Apps13 Jul 202400:54:43

☝ Dans cet Ă©pisode, nous parlons des Slowly Changing Dimensions en compagnie de Julien Hurault, de Data Validation, du script bq2dbt, de BigQuery Data Canvas, de Data Sharing avec les Snowflake Native Apps. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Julien Hurault sur LinkedIn ➕ Et le lien de sa newsletter 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Les Slowly Changing Dimensions

👉 Le Data Sharing avec les Snowflake Native Apps

👉 La Data Validation

👉 Le script python : bq2dbt

👉 BigQuery Data Canvas

Polars 1.0 et Data Vaults sur Snowflake : vers une gestion optimale des données07 Jul 202401:13:38

☝ Dans cet Ă©pisode, nous parlons de la sortie de la version 1.0 de Polars, de Smart Data, de la gestion du cycle de vie des donnĂ©es avec les Data Vaults sur Snowflake, de gestion logique des donnĂ©es et de la preview du plugin BigQuery JupyterLab.


đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn

Articles

👉 Polars version 1.0

👉 Smart Data

👉 Gestion du cycle de vie des donnĂ©es avec Data Vault sur Snowflake

👉 Plugin BigQuery JupyterLab en preview

👉 Gestion logique des donnĂ©es

Data Reliability et BigQuery Datasream : les clés pour vos données !29 Jun 202400:50:23

☝ Dans cet Ă©pisode, nous parlons de Data Reliability, de CI/CD pour les Data Engineers, de l'utilisation du mode "append-only" de Datasream sur BigQuery et des tendances et opportunitĂ©s actuelles en data.


đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 L'utilisation du mode "append-only" de Datasream sur BigQuery

👉 Data Reliability

👉 Tendances et opportunitĂ©s actuelles en data

👉 CI/CD pour les Data Engineers

LakeFlow et Unity Catalog Open Source : les nouveautés de Databricks23 Jun 202400:35:09

☝ Dans cet Ă©pisode, nous parlons de la disponibilitĂ© de LakeFlow sur Databricks, du package python Daft, de la mise en Open Source de Unity Catalog de Databricks, du rĂŽle du DPU dans l’informatique, de la future sortie de la version 2.0 de Numpy. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 La disponibilitĂ© de LakeFlow de Databricks

👉 La package python : Daft

👉 La mise en Open Source de Unity Catalog de Databricks

👉 Le rîle du DPU dans l'informatique

👉 La future sortie de NumPy 2.0

Gaël Lemaux sur les Snowflake Dynamic Tables et DuckDB 1.0 : la Data Engineering continue d'évoluer16 Jun 202400:55:50

☝ Dans cet Ă©pisode, nous parlons de Dynamics Tables sur Snowflake vs ETL/ELT, la sortie de la version 1.0.0 de DuckDB, l'intĂ©gration d’Amazon OpenSearch Service avec Amazon S3, le support de Delta Lake dans BigQuery et Variant Data Type dans Databricks. đŸ€© Nous avons Ă©galement un nouvel invitĂ© cette semaine qui est l'auteur d'un article sur les Dynamics Tables : GaĂ«l Lemaux. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 GaĂ«l sur LinkedIn 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Les Dynamics Table sur Snowflake avec GaĂ«l Lemaux

👉 La sortie de la version 1.0.0 de DuckDB

👉 L'intĂ©gration d'Amazon OpenSeach Service avec Amazon S3

👉 Le support de Delta Lake dans BigQuery

👉 Databricks sort un nouveau format de donnĂ©es : Variant

Florent Jakubowski sur ETL vs ELT et l’évolution des rĂŽles en Data Engineering07 Jun 202401:09:16

☝ Dans cet Ă©pisode, nous parlons de l'ETL vs ELT, du rĂŽle d'Analytics Engineer, de l'interprĂ©teur RustPython, du package python SQLFrame et de l'utilisation du RAG pour gĂ©nĂ©rer du SQL. đŸ€© Nous avons Ă©galement un invitĂ© qui est l'auteur d'un post LinkedIn dĂ©taillĂ© sur la comparaison entre ETL et ELT : Florent Jakubowski. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Florent sur LinkedIn 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Les diffĂ©rences d’aujourd’hui entre ETL et ELT avec Florent Jakubowski

👉 L'interprĂ©teur RustPython

👉 Le rîle d'Analytics Engineer

👉 Le package python SQLFrame

👉 L'utilisation du RAG pour gĂ©nĂ©rer du SQL

50 ans de SQL et Liquid Clustering : les nouveautés et réflexions en Data Engineering31 May 202401:02:03

☝ Dans cet Ă©pisode, nous parlons des diffĂ©rents types de stockage, de Data Quality Management, de la disponibilitĂ© gĂ©nĂ©rale du Liquid Clustering sur Databricks, des 50 ans du SQL, de contrĂŽle des coĂ»ts sur Dataflow et du dictionnaire de donnĂ©es vs le catalogue de donnĂ©es. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn Articles

👉 Les diffĂ©rents types de stockage

👉 Les 50 ans du SQL

👉 DisponibilitĂ© gĂ©nĂ©rale du Liquid Clustering sur Databricks

👉 Le Data Quality Management

👉 Dictionnaire de donnĂ©es vs Catalogue de donnĂ©es

👉 ContrĂŽle des coĂ»ts sur Dataflow

SQL automatisé, BigQuery Jobs Explorer et PostgreSQL 17 : les nouveautés à connaßtre05 Oct 202400:57:04

☝ Dans cet Ă©pisode, nous parlons de la gĂ©nĂ©ration automatisĂ©e de requĂȘtes SQL, de la prĂ©sentation de BigQuery jobs explorer, de l’intĂ©gration de PyCharm avec Databricks, de bonnes pratiques en SQL et de la sortie de PostgreSQL 17 ; đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 La gĂ©nĂ©ration automatisĂ©e de requĂȘtes SQL 👉 La prĂ©sentation de BigQuery jobs explorer 👉 L’intĂ©gration de PyCharm avec Databricks 👉 Les bonnes pratiques en SQL 👉 La sortie de PostgreSQL 17

dbt 1.8, Pandas vs Polars et réduction des coûts sur Snowflake : décryptage31 May 202400:32:29

☝ Pour ce premier Ă©pisode, nous parlons de la version 1.8 de dbt, de rĂ©duction des coĂ»ts sur Snowflake, de Pandas vs Polars et de Python sur SQL Server. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles 👉 DBT version 1.8 👉 RĂ©duction des coĂ»ts sur Snowflake 👉 Pandas vs Polars 👉 Python sur SQL Server

Pipe Syntax en SQL, Apache Iceberg et IA générative : vers une Data Engineering plus simple ?27 Sep 202400:57:11

☝ Dans cet Ă©pisode, nous parlons de l’importance de la Data Engineering dans l’IA gĂ©nĂ©rative, de la Pipe Syntax en SQL, de Data Observability, de la dĂ©perdition du Data Modeling et de cas d’usage d’Apache Iceberg dans Snowflake. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 L’importance de la Data Engineering dans l’IA gĂ©nĂ©rative 👉 La Pipe Syntax en SQL 👉 Data Observability 👉 La dĂ©perdition du Data Modeling 👉 Des cas d’usage d’Apache Iceberg dans Snowflake

Uber dans le cloud, DuckDB 1.1.0 et Pandas sur Snowflake : les annonces marquantes21 Sep 202400:39:18

☝ Dans cet Ă©pisode, nous parlons de la migration de Uber vers le cloud, de la sortie de DuckDB 1.1.0, de la sortie de Airbyte 1.0, de la classification des Data Engineers en trois groupes et de la disponibilitĂ© de Pandas sur Snowflake. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 La migration de Uber vers le cloud ; 👉 La sortie de DuckDB 1.1.0 ; 👉 La sortie de Airbyte 1.0 ; 👉 La classification des Data Engineers en trois groupes ; 👉 La disponibilitĂ© de Pandas sur Snowflake.

Uber, IA et Data Governance : les enjeux critiques de la data d'aujourd’hui15 Sep 202400:58:44

☝ Dans cet Ă©pisode, nous parlons du retour d'Elasticsearch en Open Source, des risques des dĂ©cisions basĂ©es uniquement sur la Data, de l'utilisation des rĂ©sultats d'une procĂ©dure stockĂ©e dans un SELECT sur Snowflake, des tendances de la Data Engineering avec l'IA et de Data Governance et 324 millions d'amende pour Uber đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn

➕ Newsletter de Bertrand

➕ Blog de Bertrand Articles 👉 Le retour d'Elasticsearch en Open Source 👉 Les risques des dĂ©cisions basĂ©es uniquement sur la Data 👉 Utilisation des rĂ©sultats d'une procĂ©dure stockĂ©e dans un SELECT sur Snowflake 👉 Les tendances de la Data Engineering avec l'IA 👉 Data Governance et 324 millions d'amende pour Uber

BigQuery Vector Search et Ray chez Amazon : les clés du changement ?09 Sep 202400:16:54

☝ Dans cet Ă©pisode, je parle de ScaNN sur BigQuery Vector Search, des nouveautĂ©s de Databricks Workflows, de InstantDB, de tables de faits et de dimensions et de migration d’Apache Spark vers Ray chez Amazon. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles 👉 Preview de l’algorithme ScaNN sur BigQuery Vector Search 👉 Les nouveautĂ©s de Databricks Worklfows 👉 PrĂ©sentation de InstantDB utilisĂ© dans Notion ou Figma 👉 Les tables de faits et de dimension 👉 Explication de la migration d’Apache Spark vers Ray chez Amazon

SQL avec Python, Airflow 2.10.0 et Vector Search : les tendances data du moment01 Sep 202400:11:25

☝ Dans cet Ă©pisode, je parle de l’utilisation de SQL avec python, de Apache Iceberg vs Apache Hudi, la preview du Vector Search sur MariaDB, la sortie de la version 2.10.0 d’Airflow et sur les diffĂ©rents niveaux de Data Engineers et Software Engineers đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles 👉 Utilisation de SQL avec Python 👉 Apache Iceberg vs Apache Hudi 👉 Preview de Vector Search sur MariaDB 👉 Apache Airflow 2.10.0 👉 Les niveaux de Data et Software Engineer

BigQuery Continuous Queries et Cloud SQL Studio : toujours plus de nouveautés !19 Aug 202400:12:47

☝ Dans cet Ă©pisode, je parle de Data Engineering vs Software Engineering, de Cloud SQL Studio, des fonctions d’agrĂ©gat personnaliĂ©es en python sur Snowflake, de BigQuery Continuous Queries et de recommandations pour la rĂ©solution de problĂšmes de Data Engineering. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Est-ce que la Data Engineering est du Software Engineering ?

👉 DisponibilitĂ© gĂ©nĂ©rale de Cloud SQL Studio sur GCP

👉 DisponibilitĂ© des fonctions d’agrĂ©gat customisĂ©es en python sur Snowflake

👉 Sortie en preview de BigQuery Continuous Queries

👉 Recommandations pour rĂ©soudre des problĂšmes de Data Engineering

Kafka 3.8 et Data Lake CDC : ce que les Data Engineers doivent savoir11 Aug 202400:18:34

☝ Dans cet Ă©pisode, je parle de la sortie d’Apache Kafka 3.8.0, de menaces cachĂ©es dans un Data Warehouse, de l’avenir des hyperscalers et des data centers, de simplicitĂ© et de composabilitĂ© en Data Engineering, et de Data Lake Change Data Capture. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles

👉 Apache Kafka 3.8.0

👉 Menaces cachĂ©es dans un Data Warehouse

👉 L'avenir entre hyperscalers et datacenters locaux

👉 La simplicitĂ© et la composabilitĂ© en Data Engineering

👉 Le Data Lake Change Data Capture

575K$ comme Staff Data Enginneer chez Airbnb ! Ses conseils pour décrocher ce poste06 Dec 202400:58:04

☝ Dans cet Ă©pisode, nous parlons de Microsoft Drasi, de la bascule de l’ELT vers l’esprit Graphe, de la tendance Ă  utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering, des conseils de prĂ©paration d’entretien pour un post de Staff Data Engineer chez Airbnb Ă  575K$ et les tendances 2025 pour la Data Engineering et l’IA. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 Microsoft Drasi pour la gestion des donnĂ©es en streaming 👉 La bascule de l’ELT vers l’esprit Graphe 👉 La tendance Ă  utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering 👉 La prĂ©paration d’entretien pour un post de Staff Data Engineer chez Airbnb 👉 Les tendances 2025 pour la Data Engineering et l’IA

De l’incrĂ©mental au Data Product en passant par l'IA : ce qui redĂ©finit le Data Engineering29 Nov 202400:54:09

☝ Dans cet Ă©pisode, nous parlons de la montĂ©e des traitements incrĂ©mentaux et l’impact sur la Data Quality, des Data Products pour amĂ©liorer la Data Quality des traitements incrĂ©mentaux, des Data Rooms Virtuelles, des diffĂ©rents design de pipelines de donnĂ©es, de Snowflake Intelligence et ses agents de donnĂ©es ; đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.

👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠

Articles 👉 La montĂ©e des traitements incrĂ©mentaux et l’impact sur la Data Quality 👉 Les Data Products pour amĂ©liorer la Data Quality des traitements incrĂ©mentaux 👉 Les Data Rooms Virtuelles 👉 Les diffĂ©rents design de pipelines de donnĂ©es 👉 Snowflake Intelligence et ses agents de donnĂ©es

Les stratégies data de Netflix, Meta, Spotify, Airbnb et Uber révélées !22 Nov 202401:06:00

☝ Dans cet Ă©pisode, nous parlons des donnĂ©es synthĂ©tiques pour des donnĂ©es sĂ©curisĂ©es avec l’IA, des rĂšgles de base et des rĂšgles mĂ©tier dans la DataQuality, sur le besoin d’utiliser les bons tests dans un projet dbt, des Data Silos et des architectures de Data Engineering utilisĂ©es par Netflix, Uber, Spotify, Meta et Airbnb ;


đŸŽ™ïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.


👉 ⁠⁠⁠Axel sur LinkedIn⁠⁠⁠

👉 ⁠⁠⁠Bertrand sur LinkedIn ⁠⁠⁠

➕ ⁠⁠⁠Newsletter de Bertrand⁠⁠⁠

➕ ⁠⁠⁠Blog de Bertrand⁠⁠


Articles

👉 Des donnĂ©es synthĂ©tiques pour des donnĂ©es sĂ©curisĂ©es avec l’IA

👉 Les rĂšgles de base et les rĂšgles mĂ©tier dans la DataQuality

👉 Le besoin d’utiliser les bons tests dans un projet dbt

👉 Les Data Silos

👉 Les architectures de Data Engineering utilisĂ©es par Netflix, Uber, Spotify, Meta et Airbnb

Data Engineer 2.0 : clustering, IA, et plan pour 202515 Nov 202401:09:41

☝ Dans cet Ă©pisode, nous parlons des clĂ©s de clustering sur Snowflake, du rĂŽle de l’AI Data Engineer, de la disponibilitĂ© des vues matĂ©rialisĂ©es et des tables de streaming pour AWS et Azure, de la planification de fin d’annĂ©e pour les objectifs 2025 et de l’utilisation du streaming de donnĂ©es pour le dĂ©veloppement des futurs services financiers ;


đŸŽ™ïž DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.


👉 ⁠⁠Axel sur LinkedIn⁠⁠

👉 ⁠⁠Bertrand sur LinkedIn ⁠⁠

➕ ⁠⁠Newsletter de Bertrand⁠⁠

➕ ⁠⁠Blog de Bertrand⁠⁠


Articles

👉 Les clĂ©s de clustering sur Snowflake

👉 Le rîle de l’AI Data Engineer

👉 La disponibilitĂ© des vues matĂ©rialisĂ©es et des tables de streaming pour AWS et Azure

👉 La planification de fin d’annĂ©e pour les objectifs 2025

👉 L’utilisation du streaming de donnĂ©es pour le dĂ©veloppement des futurs services financiers

Le premier Data Engineer IA et la surveillance des pipelines : décryptage08 Nov 202401:06:49

☝ Dans cet Ă©pisode, nous parlons de l’organisation des Ă©quipes logiciel et data, des trois composants d’une stack de donnĂ©es non structurĂ©es, de la stratĂ©gie de surveillance des pipelines ETL, du premier data Engineer IA au monde et de la rĂ©alitĂ© des formats de tables ouverts ;


đŸŽ™ïž DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.


👉 ⁠Axel sur LinkedIn⁠

👉 ⁠Bertrand sur LinkedIn ⁠

➕ ⁠Newsletter de Bertrand⁠

➕ ⁠Blog de Bertrand⁠


Articles :

👉 ⁠L’organisation des Ă©quipes logiciel et data⁠

👉 ⁠Les trois composants d’une stack de donnĂ©es non structurĂ©es⁠

👉 ⁠La stratĂ©gie de surveillance des pipelines ETL⁠

👉 ⁠Le premier data Engineer IA au monde⁠

👉 ⁠La rĂ©alitĂ© des formats de tables ouverts

Data Mesh, Data Owner et la fin des clés primaires : ce que vous devez savoir01 Nov 202401:14:14

☝ Dans cet Ă©pisode, nous parlons de la mort des clĂ©s primaires et Ă©trangĂšres, de l’implĂ©mentation du Data Mesh chez Roche, du Github Actions pour la Data Engineering, de la Data Stack dĂ©clarative et du rĂŽle de Data Owner ; đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles

👉 La mort des clĂ©s primaires et Ă©trangĂšres 👉 La Data Observability lors de l’implĂ©mentation du Data Mesh chez Roche 👉 Github Actions pour la Data Engineering 👉 La Data Stack dĂ©clarative 👉 Le rĂŽle de Data Owner

BigQuery, dbt v1.9 et Data Quality : les stratégies qui transforment la donnée25 Oct 202400:48:58

☝ Dans cet Ă©pisode, nous parlons des stratĂ©gies innovantes en Data Engineering, de la preview des datasets externes entre BigQuery et Spanner, de la preview des tables BigQuery pour Apache Iceberg, du micro batch incremental models de la v1.9 de dbt, du Data Quality Management ; đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 Les stratĂ©gies innovantes en Data Engineering 👉 La preview des datasets externes entre BigQuery et Spanner 👉 La preview des tables BigQuery pour Apache Iceberg 👉 Le micro batch incremental models de la v1.9 de dbt 👉 Data Quality Management

Data Engineer, ça craint ou pas ?24 Mar 202500:57:01

☝ Dans cet Ă©pisode, nous parlons des nouveautĂ©s de Databricks SQL de fĂ©vrier 2025, du rachat de DataStax par IBM pour renforcer watsonx et l'IA gĂ©nĂ©rative, de la sortie d'Apache Beam 2.63.0, des graphiques d'utilisation des ressources BigQuery, du rĂ©examen du GROUP BY ROLLUP avec un exemple plus rĂ©aliste, des difficultĂ©s du mĂ©tier de Data Engineer et de l'Ă©tat actuel de l'architecture Lakehouse.

đŸŽ™ïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.

👉 ⁠⁠⁠Axel sur LinkedIn⁠⁠⁠

👉 ⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠

➕ ⁠⁠⁠Newsletter de Bertrand⁠⁠⁠

➕ ⁠⁠⁠Blog de Bertrand⁠⁠

Articles⁠👉 Graphiques d'utilisation des ressources BigQuery 👉 The State of Lakehouse Architecture👉 IBM rachĂšte DataStax pour renforcer watsonx et l'IA gĂ©nĂ©rative👉 Etre Data Engineer ça craint👉 Apache Beam 2.63.0 👉 NouveautĂ©s de Databricks SQL, fĂ©vrier 2025 👉 RĂ©examen du GROUP BY ROLLUP avec un exemple plus rĂ©aliste

La disparition des Data Engineers !01 Mar 202500:48:23

☝ Dans cet Ă©pisode, nous parlons de l'acquisition de Voyage AI par MongoDB, de l'exĂ©cution des LLM open-source sur BigQuery ML, de l'acquisition d'Upsolver par Qlik, de la levĂ©e de fonds de 47 millions de dollars par Prophecy, de l'optimisation du moteur vectoriel d'OpenSearch, de la mĂ©thode pour simplifier votre code Python avec l'opĂ©rateur walrus, l'avenir du mĂ©tier de Data Engineer face aux IA et l'avenir des donnĂ©es non structurĂ©es dans le Data Engineering.

đŸŽ™ïž DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.

👉 ⁠⁠Axel sur LinkedIn⁠⁠

👉 ⁠⁠Bertrand sur LinkedIn⁠⁠

➕ ⁠⁠Newsletter de Bertrand⁠⁠

➕ ⁠⁠Blog de Bertrand⁠


Articles

👉 MongoDB annonce l'acquisition de Voyage AI pour permettre aux organisations de construire des applications d’IA fiables ⁠

👉 Prophecy lùve 47 millions de dollars de fonds

👉 Optimisation du moteur vectoriel d'OpenSearch ⁠

👉 Les Data Engineers vont ils devenirs obsolùtes ?

👉 Les donnĂ©es non structurĂ©es sont l'avenir du Data Engineering

👉 ExĂ©cuter des LLM open-source sur BigQuery ML

👉 Qlik acquiert Upsolver pour proposer l’ingestion et l’optimisation à faible latence pour Apache Iceberg

Les outils essentiels du Data Engineer ! 500Mds$ dans la data 💰04 Feb 202500:43:33

☝ Dans cet Ă©pisode, nous parlons du rachat de SDF par dbt, du plan de Donald Trump de 500 milliards de $ pour l'IA, des outils essentiels en Data Engineering et de l'architecture des pipelines de donnĂ©es chez BlaBlaCar. đŸŽ™ïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data. 👉 ⁠Axel sur LinkedIn⁠ 👉 ⁠Bertrand sur LinkedIn⁠ ➕ ⁠Newsletter de Bertrand⁠ ➕ ⁠Blog de Bertrand Articles 👉 Tobiko - dbt + SDF : Ce qui change et ce qui ne change pas 👉 Donald Trump annonce son plan de 500 milliards de $ pour l'IA 👉 Architecture des pipelines de donnĂ©es chez BlaBlaCar 👉 La boĂźte Ă  outils en Data Engineering : Les Outils essentiels

Shift Left, la data change de responsable !01 Apr 202500:17:30

☝ Dans cet Ă©pisode, nous parlons de l'annonce de la prise en charge de Git dans BigQuery, du lancement de dbt copilot pour amĂ©liorer l’efficacitĂ© des dĂ©veloppeurs, du Shift Left, du Sommet Databricks Data + AI 2025, et de l'investissement de Snowflake Ventures dans DataOps.live.đŸŽ™ïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour d’articles publiĂ©s rĂ©cemment en data.


👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠Articles👉 Annonce des dĂ©pĂŽts BigQuery 👉 DBT Labs lance un copilote d'IA 👉 Databricks Data + AI 2025 👉 Snowflake Ventures investit dans DataOps.live 👉 Le Manifeste des donnĂ©es de Shift Left

© My Podcast Data