Retour

Explorez tous les épisodes du podcast DataWatch

Plongez dans la liste complète des épisodes de DataWatch. Chaque épisode est catalogué accompagné de descriptions détaillées, ce qui facilite la recherche et l'exploration de sujets spécifiques. Suivez tous les épisodes de votre podcast préféré et ne manquez aucun contenu pertinent.

Rows per page:

1–50 of 50

TitreDateDurée
MongoDB 8.0, Python 3.13 et Lakehouse : les annonces phares du moment18 Oct 202400:53:37

☝️ Dans cet épisode, nous parlons de la sortie de la version 3.13.0 de Python, de la mort du Data Warehouse au profit du Data Lake House, de la Preview des Databricks Apps, de la sortie de la version 8.0 de MongoDB et de Data Strategy. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn Newsletter de Bertrand Blog de Bertrand Articles 👉 La sortie de la version 3.13.0 de Python 👉 La mort du Data Warehouse au profit du Data Lake House 👉 La Preview des Databricks Apps 👉 La sortie de la version 8.0 de MongoDB et de Data Strategy 👉 La Data Strategy

Presto, Rust et Data Lineage : les tendances qui transforment la Data Engineering11 Oct 202400:41:55

☝️ Dans cet épisode, nous parlons de l’importance de Presto et de son framework d’optimisation basé sur l’historique, de l’utilisation de Rust dans la Data Engineering, de l’implémentation du Data Lineage dans les traitements python, de la balance entre achat et création d’outils Data et de la sortie de la version 1.0.0 de dlt. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedInNewsletter de BertrandBlog de Bertrand Articles 👉 Presto et son framework d’optimisation basé sur l’historique 👉 L’utilisation de Rust dans la Data Engineering 👉 L’implémentation du Data Lineage dans les traitements python 👉 La balance entre achat et création d’outils Data 👉 La sortie de la version 1.0.0 de dlt

Cycle de vie du stockage : pourquoi cela peut transformer vos coûts data ?04 Aug 202400:21:01

☝️ Dans cet épisode, je parle de 5 erreurs en Data Engineering, des bénéfices économiques dans la mise en place d’une politique de cycle de vie du stockage, de Snowflake Horizon, de l’utilisation de la simplicité pour résoudre les problèmes, et de différentes techniques de Data Modeling. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 5 erreurs en Data Engineering

👉 Les économies d’une politique de cycle de vie du stockage

👉 Snowflake Horizon pour une gouvernance unifiée

👉 L’utilisation de la simplicité pour résoudre les problèmes

👉 Différentes techniques de Data Modeling

Data Centers, souveraineté et qualité : les défis de la gestion des données27 Jul 202400:16:42

☝️ Dans cet épisode, nous parlons de souveraineté des données, de Exadata Exascale de Oracle, de Data Timeliness, de 3 étapes pour la mise en place de Data Quality et de la croissance des Data Centers. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Cette semaine, je serai exceptionnellement seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 La souveraineté des données

👉 Exadata Exascale de Oracle

👉 Data Timeliness

👉 3 étapes pour la mise en place de Data Quality

👉 La croissance fulgurante des Data Centers

Polars vs PySpark et quand l'OLTP et l'OLAP convergent enfin avec Snowflake !20 Jul 202401:09:38

☝️ Dans cet épisode, nous parlons de Polars vs PySpark, de la création d’une couche sémantique des données, de conseils pour leader une équipe data, de la convergence de l’OLTP et de l’OLAP avec Unistore de Snowflake et de l’histoire de la Modern Data Stack.


🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.


👉 Axel sur LinkedIn

👉 Bertrand sur LinkedIn


Articles

👉 Polars vs PySpark

👉 Conseils pour leader une équipe data

👉 Couche sémantique des données avec dbt

👉 Unistore, la convergence de l’OLTP et de l’OLAP

👉 L’histoire de la Modern Data Stack

Julien Hurault sur les Slowly Changing Dimensions et les Snowflake Native Apps13 Jul 202400:54:43

☝️ Dans cet épisode, nous parlons des Slowly Changing Dimensions en compagnie de Julien Hurault, de Data Validation, du script bq2dbt, de BigQuery Data Canvas, de Data Sharing avec les Snowflake Native Apps. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Julien Hurault sur LinkedInEt le lien de sa newsletter 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Les Slowly Changing Dimensions

👉 Le Data Sharing avec les Snowflake Native Apps

👉 La Data Validation

👉 Le script python : bq2dbt

👉 BigQuery Data Canvas

Polars 1.0 et Data Vaults sur Snowflake : vers une gestion optimale des données07 Jul 202401:13:38

☝️ Dans cet épisode, nous parlons de la sortie de la version 1.0 de Polars, de Smart Data, de la gestion du cycle de vie des données avec les Data Vaults sur Snowflake, de gestion logique des données et de la preview du plugin BigQuery JupyterLab.


🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn

Articles

👉 Polars version 1.0

👉 Smart Data

👉 Gestion du cycle de vie des données avec Data Vault sur Snowflake

👉 Plugin BigQuery JupyterLab en preview

👉 Gestion logique des données

Data Reliability et BigQuery Datasream : les clés pour vos données !29 Jun 202400:50:23

☝️ Dans cet épisode, nous parlons de Data Reliability, de CI/CD pour les Data Engineers, de l'utilisation du mode "append-only" de Datasream sur BigQuery et des tendances et opportunités actuelles en data.


🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 L'utilisation du mode "append-only" de Datasream sur BigQuery

👉 Data Reliability

👉 Tendances et opportunités actuelles en data

👉 CI/CD pour les Data Engineers

LakeFlow et Unity Catalog Open Source : les nouveautés de Databricks23 Jun 202400:35:09

☝️ Dans cet épisode, nous parlons de la disponibilité de LakeFlow sur Databricks, du package python Daft, de la mise en Open Source de Unity Catalog de Databricks, du rôle du DPU dans l’informatique, de la future sortie de la version 2.0 de Numpy. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 La disponibilité de LakeFlow de Databricks

👉 La package python : Daft

👉 La mise en Open Source de Unity Catalog de Databricks

👉 Le rôle du DPU dans l'informatique

👉 La future sortie de NumPy 2.0

Gaël Lemaux sur les Snowflake Dynamic Tables et DuckDB 1.0 : la Data Engineering continue d'évoluer16 Jun 202400:55:50

☝️ Dans cet épisode, nous parlons de Dynamics Tables sur Snowflake vs ETL/ELT, la sortie de la version 1.0.0 de DuckDB, l'intégration d’Amazon OpenSearch Service avec Amazon S3, le support de Delta Lake dans BigQuery et Variant Data Type dans Databricks. 🤩 Nous avons également un nouvel invité cette semaine qui est l'auteur d'un article sur les Dynamics Tables : Gaël Lemaux. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Gaël sur LinkedIn 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Les Dynamics Table sur Snowflake avec Gaël Lemaux

👉 La sortie de la version 1.0.0 de DuckDB

👉 L'intégration d'Amazon OpenSeach Service avec Amazon S3

👉 Le support de Delta Lake dans BigQuery

👉 Databricks sort un nouveau format de données : Variant

Florent Jakubowski sur ETL vs ELT et l’évolution des rôles en Data Engineering07 Jun 202401:09:16

☝️ Dans cet épisode, nous parlons de l'ETL vs ELT, du rôle d'Analytics Engineer, de l'interpréteur RustPython, du package python SQLFrame et de l'utilisation du RAG pour générer du SQL. 🤩 Nous avons également un invité qui est l'auteur d'un post LinkedIn détaillé sur la comparaison entre ETL et ELT : Florent Jakubowski. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Florent sur LinkedIn 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Les différences d’aujourd’hui entre ETL et ELT avec Florent Jakubowski

👉 L'interpréteur RustPython

👉 Le rôle d'Analytics Engineer

👉 Le package python SQLFrame

👉 L'utilisation du RAG pour générer du SQL

50 ans de SQL et Liquid Clustering : les nouveautés et réflexions en Data Engineering31 May 202401:02:03

☝️ Dans cet épisode, nous parlons des différents types de stockage, de Data Quality Management, de la disponibilité générale du Liquid Clustering sur Databricks, des 50 ans du SQL, de contrôle des coûts sur Dataflow et du dictionnaire de données vs le catalogue de données. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn Articles

👉 Les différents types de stockage

👉 Les 50 ans du SQL

👉 Disponibilité générale du Liquid Clustering sur Databricks

👉 Le Data Quality Management

👉 Dictionnaire de données vs Catalogue de données

👉 Contrôle des coûts sur Dataflow

SQL automatisé, BigQuery Jobs Explorer et PostgreSQL 17 : les nouveautés à connaître05 Oct 202400:57:04

☝️ Dans cet épisode, nous parlons de la génération automatisée de requêtes SQL, de la présentation de BigQuery jobs explorer, de l’intégration de PyCharm avec Databricks, de bonnes pratiques en SQL et de la sortie de PostgreSQL 17 ; 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn Newsletter de BertrandBlog de Bertrand Articles 👉 La génération automatisée de requêtes SQL 👉 La présentation de BigQuery jobs explorer 👉 L’intégration de PyCharm avec Databricks 👉 Les bonnes pratiques en SQL 👉 La sortie de PostgreSQL 17

dbt 1.8, Pandas vs Polars et réduction des coûts sur Snowflake : décryptage31 May 202400:32:29

☝️ Pour ce premier épisode, nous parlons de la version 1.8 de dbt, de réduction des coûts sur Snowflake, de Pandas vs Polars et de Python sur SQL Server. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles 👉 DBT version 1.8 👉 Réduction des coûts sur Snowflake 👉 Pandas vs Polars 👉 Python sur SQL Server

Pipe Syntax en SQL, Apache Iceberg et IA générative : vers une Data Engineering plus simple ?27 Sep 202400:57:11

☝️ Dans cet épisode, nous parlons de l’importance de la Data Engineering dans l’IA générative, de la Pipe Syntax en SQL, de Data Observability, de la déperdition du Data Modeling et de cas d’usage d’Apache Iceberg dans Snowflake. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedInNewsletter de BertrandBlog de Bertrand Articles 👉 L’importance de la Data Engineering dans l’IA générative 👉 La Pipe Syntax en SQL 👉 Data Observability 👉 La déperdition du Data Modeling 👉 Des cas d’usage d’Apache Iceberg dans Snowflake

Uber dans le cloud, DuckDB 1.1.0 et Pandas sur Snowflake : les annonces marquantes21 Sep 202400:39:18

☝️ Dans cet épisode, nous parlons de la migration de Uber vers le cloud, de la sortie de DuckDB 1.1.0, de la sortie de Airbyte 1.0, de la classification des Data Engineers en trois groupes et de la disponibilité de Pandas sur Snowflake. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedInNewsletter de BertrandBlog de Bertrand Articles 👉 La migration de Uber vers le cloud ; 👉 La sortie de DuckDB 1.1.0 ; 👉 La sortie de Airbyte 1.0 ; 👉 La classification des Data Engineers en trois groupes ; 👉 La disponibilité de Pandas sur Snowflake.

Uber, IA et Data Governance : les enjeux critiques de la data d'aujourd’hui15 Sep 202400:58:44

☝️ Dans cet épisode, nous parlons du retour d'Elasticsearch en Open Source, des risques des décisions basées uniquement sur la Data, de l'utilisation des résultats d'une procédure stockée dans un SELECT sur Snowflake, des tendances de la Data Engineering avec l'IA et de Data Governance et 324 millions d'amende pour Uber 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn

Newsletter de Bertrand

Blog de Bertrand Articles 👉 Le retour d'Elasticsearch en Open Source 👉 Les risques des décisions basées uniquement sur la Data 👉 Utilisation des résultats d'une procédure stockée dans un SELECT sur Snowflake 👉 Les tendances de la Data Engineering avec l'IA 👉 Data Governance et 324 millions d'amende pour Uber

BigQuery Vector Search et Ray chez Amazon : les clés du changement ?09 Sep 202400:16:54

☝️ Dans cet épisode, je parle de ScaNN sur BigQuery Vector Search, des nouveautés de Databricks Workflows, de InstantDB, de tables de faits et de dimensions et de migration d’Apache Spark vers Ray chez Amazon. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles 👉 Preview de l’algorithme ScaNN sur BigQuery Vector Search 👉 Les nouveautés de Databricks Worklfows 👉 Présentation de InstantDB utilisé dans Notion ou Figma 👉 Les tables de faits et de dimension 👉 Explication de la migration d’Apache Spark vers Ray chez Amazon

SQL avec Python, Airflow 2.10.0 et Vector Search : les tendances data du moment01 Sep 202400:11:25

☝️ Dans cet épisode, je parle de l’utilisation de SQL avec python, de Apache Iceberg vs Apache Hudi, la preview du Vector Search sur MariaDB, la sortie de la version 2.10.0 d’Airflow et sur les différents niveaux de Data Engineers et Software Engineers 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles 👉 Utilisation de SQL avec Python 👉 Apache Iceberg vs Apache Hudi 👉 Preview de Vector Search sur MariaDB 👉 Apache Airflow 2.10.0 👉 Les niveaux de Data et Software Engineer

BigQuery Continuous Queries et Cloud SQL Studio : toujours plus de nouveautés !19 Aug 202400:12:47

☝️ Dans cet épisode, je parle de Data Engineering vs Software Engineering, de Cloud SQL Studio, des fonctions d’agrégat personnaliées en python sur Snowflake, de BigQuery Continuous Queries et de recommandations pour la résolution de problèmes de Data Engineering. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn


Articles

👉 Est-ce que la Data Engineering est du Software Engineering ?

👉 Disponibilité générale de Cloud SQL Studio sur GCP

👉 Disponibilité des fonctions d’agrégat customisées en python sur Snowflake

👉 Sortie en preview de BigQuery Continuous Queries

👉 Recommandations pour résoudre des problèmes de Data Engineering

Kafka 3.8 et Data Lake CDC : ce que les Data Engineers doivent savoir11 Aug 202400:18:34

☝️ Dans cet épisode, je parle de la sortie d’Apache Kafka 3.8.0, de menaces cachées dans un Data Warehouse, de l’avenir des hyperscalers et des data centers, de simplicité et de composabilité en Data Engineering, et de Data Lake Change Data Capture. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles

👉 Apache Kafka 3.8.0

👉 Menaces cachées dans un Data Warehouse

👉 L'avenir entre hyperscalers et datacenters locaux

👉 La simplicité et la composabilité en Data Engineering

👉 Le Data Lake Change Data Capture

575K$ comme Staff Data Enginneer chez Airbnb ! Ses conseils pour décrocher ce poste06 Dec 202400:58:04

☝️ Dans cet épisode, nous parlons de Microsoft Drasi, de la bascule de l’ELT vers l’esprit Graphe, de la tendance à utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering, des conseils de préparation d’entretien pour un post de Staff Data Engineer chez Airbnb à 575K$ et les tendances 2025 pour la Data Engineering et l’IA. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedInNewsletter de BertrandBlog de Bertrand Articles 👉 Microsoft Drasi pour la gestion des données en streaming 👉 La bascule de l’ELT vers l’esprit Graphe 👉 La tendance à utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering 👉 La préparation d’entretien pour un post de Staff Data Engineer chez Airbnb 👉 Les tendances 2025 pour la Data Engineering et l’IA

De l’incrémental au Data Product en passant par l'IA : ce qui redéfinit le Data Engineering29 Nov 202400:54:09

☝️ Dans cet épisode, nous parlons de la montée des traitements incrémentaux et l’impact sur la Data Quality, des Data Products pour améliorer la Data Quality des traitements incrémentaux, des Data Rooms Virtuelles, des différents design de pipelines de données, de Snowflake Intelligence et ses agents de données ; 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn ⁠⁠⁠⁠

⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠

⁠⁠⁠⁠Blog de Bertrand⁠⁠

Articles 👉 La montée des traitements incrémentaux et l’impact sur la Data Quality 👉 Les Data Products pour améliorer la Data Quality des traitements incrémentaux 👉 Les Data Rooms Virtuelles 👉 Les différents design de pipelines de données 👉 Snowflake Intelligence et ses agents de données

Les stratégies data de Netflix, Meta, Spotify, Airbnb et Uber révélées !22 Nov 202401:06:00

☝️ Dans cet épisode, nous parlons des données synthétiques pour des données sécurisées avec l’IA, des règles de base et des règles métier dans la DataQuality, sur le besoin d’utiliser les bons tests dans un projet dbt, des Data Silos et des architectures de Data Engineering utilisées par Netflix, Uber, Spotify, Meta et Airbnb ;


🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.


👉 ⁠⁠⁠Axel sur LinkedIn⁠⁠⁠

👉 ⁠⁠⁠Bertrand sur LinkedIn ⁠⁠⁠

⁠⁠⁠Newsletter de Bertrand⁠⁠⁠

⁠⁠⁠Blog de Bertrand⁠⁠


Articles

👉 Des données synthétiques pour des données sécurisées avec l’IA

👉 Les règles de base et les règles métier dans la DataQuality

👉 Le besoin d’utiliser les bons tests dans un projet dbt

👉 Les Data Silos

👉 Les architectures de Data Engineering utilisées par Netflix, Uber, Spotify, Meta et Airbnb

Data Engineer 2.0 : clustering, IA, et plan pour 202515 Nov 202401:09:41

☝️ Dans cet épisode, nous parlons des clés de clustering sur Snowflake, du rôle de l’AI Data Engineer, de la disponibilité des vues matérialisées et des tables de streaming pour AWS et Azure, de la planification de fin d’année pour les objectifs 2025 et de l’utilisation du streaming de données pour le développement des futurs services financiers ;


🎙️ DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.


👉 ⁠⁠Axel sur LinkedIn⁠⁠

👉 ⁠⁠Bertrand sur LinkedIn ⁠⁠

⁠⁠Newsletter de Bertrand⁠⁠

⁠⁠Blog de Bertrand⁠⁠


Articles

👉 Les clés de clustering sur Snowflake

👉 Le rôle de l’AI Data Engineer

👉 La disponibilité des vues matérialisées et des tables de streaming pour AWS et Azure

👉 La planification de fin d’année pour les objectifs 2025

👉 L’utilisation du streaming de données pour le développement des futurs services financiers

Le premier Data Engineer IA et la surveillance des pipelines : décryptage08 Nov 202401:06:49

☝️ Dans cet épisode, nous parlons de l’organisation des équipes logiciel et data, des trois composants d’une stack de données non structurées, de la stratégie de surveillance des pipelines ETL, du premier data Engineer IA au monde et de la réalité des formats de tables ouverts ;


🎙️ DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.


👉 ⁠Axel sur LinkedIn⁠

👉 ⁠Bertrand sur LinkedIn ⁠

⁠Newsletter de Bertrand⁠

⁠Blog de Bertrand⁠


Articles :

👉 ⁠L’organisation des équipes logiciel et data⁠

👉 ⁠Les trois composants d’une stack de données non structurées⁠

👉 ⁠La stratégie de surveillance des pipelines ETL⁠

👉 ⁠Le premier data Engineer IA au monde⁠

👉 ⁠La réalité des formats de tables ouverts

Data Mesh, Data Owner et la fin des clés primaires : ce que vous devez savoir01 Nov 202401:14:14

☝️ Dans cet épisode, nous parlons de la mort des clés primaires et étrangères, de l’implémentation du Data Mesh chez Roche, du Github Actions pour la Data Engineering, de la Data Stack déclarative et du rôle de Data Owner ; 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedInNewsletter de BertrandBlog de Bertrand Articles

👉 La mort des clés primaires et étrangères 👉 La Data Observability lors de l’implémentation du Data Mesh chez Roche 👉 Github Actions pour la Data Engineering 👉 La Data Stack déclarative 👉 Le rôle de Data Owner

BigQuery, dbt v1.9 et Data Quality : les stratégies qui transforment la donnée25 Oct 202400:48:58

☝️ Dans cet épisode, nous parlons des stratégies innovantes en Data Engineering, de la preview des datasets externes entre BigQuery et Spanner, de la preview des tables BigQuery pour Apache Iceberg, du micro batch incremental models de la v1.9 de dbt, du Data Quality Management ; 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn Newsletter de Bertrand Blog de Bertrand Articles 👉 Les stratégies innovantes en Data Engineering 👉 La preview des datasets externes entre BigQuery et Spanner 👉 La preview des tables BigQuery pour Apache Iceberg 👉 Le micro batch incremental models de la v1.9 de dbt 👉 Data Quality Management

Data Engineer, ça craint ou pas ?24 Mar 202500:57:01

☝️ Dans cet épisode, nous parlons des nouveautés de Databricks SQL de février 2025, du rachat de DataStax par IBM pour renforcer watsonx et l'IA générative, de la sortie d'Apache Beam 2.63.0, des graphiques d'utilisation des ressources BigQuery, du réexamen du GROUP BY ROLLUP avec un exemple plus réaliste, des difficultés du métier de Data Engineer et de l'état actuel de l'architecture Lakehouse.

🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠Axel sur LinkedIn⁠⁠⁠

👉 ⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠

⁠⁠⁠Newsletter de Bertrand⁠⁠⁠

⁠⁠⁠Blog de Bertrand⁠⁠

Articles👉 Graphiques d'utilisation des ressources BigQuery 👉 The State of Lakehouse Architecture👉 IBM rachète DataStax pour renforcer watsonx et l'IA générative👉 Etre Data Engineer ça craint👉 Apache Beam 2.63.0 👉 Nouveautés de Databricks SQL, février 2025 👉 Réexamen du GROUP BY ROLLUP avec un exemple plus réaliste

La disparition des Data Engineers !01 Mar 202500:48:23

☝️ Dans cet épisode, nous parlons de l'acquisition de Voyage AI par MongoDB, de l'exécution des LLM open-source sur BigQuery ML, de l'acquisition d'Upsolver par Qlik, de la levée de fonds de 47 millions de dollars par Prophecy, de l'optimisation du moteur vectoriel d'OpenSearch, de la méthode pour simplifier votre code Python avec l'opérateur walrus, l'avenir du métier de Data Engineer face aux IA et l'avenir des données non structurées dans le Data Engineering.

🎙️ DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠Axel sur LinkedIn⁠⁠

👉 ⁠⁠Bertrand sur LinkedIn⁠⁠

⁠⁠Newsletter de Bertrand⁠⁠

⁠⁠Blog de Bertrand⁠


Articles

👉 MongoDB annonce l'acquisition de Voyage AI pour permettre aux organisations de construire des applications d’IA fiables

👉 Prophecy lève 47 millions de dollars de fonds

👉 Optimisation du moteur vectoriel d'OpenSearch

👉 Les Data Engineers vont ils devenirs obsolètes ?

👉 Les données non structurées sont l'avenir du Data Engineering

👉 Exécuter des LLM open-source sur BigQuery ML

👉 Qlik acquiert Upsolver pour proposer l’ingestion et l’optimisation à faible latence pour Apache Iceberg

Les outils essentiels du Data Engineer ! 500Mds$ dans la data 💰04 Feb 202500:43:33

☝️ Dans cet épisode, nous parlons du rachat de SDF par dbt, du plan de Donald Trump de 500 milliards de $ pour l'IA, des outils essentiels en Data Engineering et de l'architecture des pipelines de données chez BlaBlaCar. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 ⁠Axel sur LinkedIn⁠ 👉 ⁠Bertrand sur LinkedIn⁠⁠Newsletter de Bertrand⁠⁠Blog de Bertrand Articles 👉 Tobiko - dbt + SDF : Ce qui change et ce qui ne change pas 👉 Donald Trump annonce son plan de 500 milliards de $ pour l'IA 👉 Architecture des pipelines de données chez BlaBlaCar 👉 La boîte à outils en Data Engineering : Les Outils essentiels

Shift Left, la data change de responsable !01 Apr 202500:17:30

☝️ Dans cet épisode, nous parlons de l'annonce de la prise en charge de Git dans BigQuery, du lancement de dbt copilot pour améliorer l’efficacité des développeurs, du Shift Left, du Sommet Databricks Data + AI 2025, et de l'investissement de Snowflake Ventures dans DataOps.live.🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.


👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠

⁠⁠⁠⁠Blog de Bertrand⁠⁠Articles👉 Annonce des dépôts BigQuery 👉 DBT Labs lance un copilote d'IA 👉 Databricks Data + AI 2025 👉 Snowflake Ventures investit dans DataOps.live 👉 Le Manifeste des données de Shift Left

© My Podcast Data