Explore every episode of the podcast DataWatch
| Title | Pub. Date | Duration | |
|---|---|---|---|
| MongoDB 8.0, Python 3.13 et Lakehouse : les annonces phares du moment | 18 Oct 2024 | 00:53:37 | |
âïž Dans cet Ă©pisode, nous parlons de la sortie de la version 3.13.0 de Python, de la mort du Data Warehouse au profit du Data Lake House, de la Preview des Databricks Apps, de la sortie de la version 8.0 de MongoDB et de Data Strategy. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ La sortie de la version 3.13.0 de Python đ La mort du Data Warehouse au profit du Data Lake House đ La Preview des Databricks Apps đ La sortie de la version 8.0 de MongoDB et de Data Strategy đ La Data Strategy | |||
| Presto, Rust et Data Lineage : les tendances qui transforment la Data Engineering | 11 Oct 2024 | 00:41:55 | |
âïž Dans cet Ă©pisode, nous parlons de lâimportance de Presto et de son framework dâoptimisation basĂ© sur lâhistorique, de lâutilisation de Rust dans la Data Engineering, de lâimplĂ©mentation du Data Lineage dans les traitements python, de la balance entre achat et crĂ©ation dâoutils Data et de la sortie de la version 1.0.0 de dlt. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ Presto et son framework dâoptimisation basĂ© sur lâhistorique đ Lâutilisation de Rust dans la Data Engineering đ LâimplĂ©mentation du Data Lineage dans les traitements python đ La balance entre achat et crĂ©ation dâoutils Data đ La sortie de la version 1.0.0 de dlt | |||
| Cycle de vie du stockage : pourquoi cela peut transformer vos coûts data ? | 04 Aug 2024 | 00:21:01 | |
âïž Dans cet Ă©pisode, je parle de 5 erreurs en Data Engineering, des bĂ©nĂ©fices Ă©conomiques dans la mise en place dâune politique de cycle de vie du stockage, de Snowflake Horizon, de lâutilisation de la simplicitĂ© pour rĂ©soudre les problĂšmes, et de diffĂ©rentes techniques de Data Modeling. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ 5 erreurs en Data Engineering đ Les Ă©conomies dâune politique de cycle de vie du stockage đ Snowflake Horizon pour une gouvernance unifiĂ©e đ Lâutilisation de la simplicitĂ© pour rĂ©soudre les problĂšmes | |||
| Data Centers, souveraineté et qualité : les défis de la gestion des données | 27 Jul 2024 | 00:16:42 | |
âïž Dans cet Ă©pisode, nous parlons de souverainetĂ© des donnĂ©es, de Exadata Exascale de Oracle, de Data Timeliness, de 3 Ă©tapes pour la mise en place de Data Quality et de la croissance des Data Centers. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. Cette semaine, je serai exceptionnellement seul pour animer le podcast. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ La souverainetĂ© des donnĂ©es đ Exadata Exascale de Oracle đ Data Timeliness | |||
| Polars vs PySpark et quand l'OLTP et l'OLAP convergent enfin avec Snowflake ! | 20 Jul 2024 | 01:09:38 | |
âïž Dans cet Ă©pisode, nous parlons de Polars vs PySpark, de la crĂ©ation dâune couche sĂ©mantique des donnĂ©es, de conseils pour leader une Ă©quipe data, de la convergence de lâOLTP et de lâOLAP avec Unistore de Snowflake et de lâhistoire de la Modern Data Stack. đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn Articles đ Polars vs PySpark đ Conseils pour leader une Ă©quipe data đ Couche sĂ©mantique des donnĂ©es avec dbt | |||
| Julien Hurault sur les Slowly Changing Dimensions et les Snowflake Native Apps | 13 Jul 2024 | 00:54:43 | |
âïž Dans cet Ă©pisode, nous parlons des Slowly Changing Dimensions en compagnie de Julien Hurault, de Data Validation, du script bq2dbt, de BigQuery Data Canvas, de Data Sharing avec les Snowflake Native Apps. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Julien Hurault sur LinkedIn â Et le lien de sa newsletter đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Les Slowly Changing Dimensions đ Le Data Sharing avec les Snowflake Native Apps đ La Data Validation đ Le script python : bq2dbt đ BigQuery Data Canvas | |||
| Polars 1.0 et Data Vaults sur Snowflake : vers une gestion optimale des données | 07 Jul 2024 | 01:13:38 | |
âïž Dans cet Ă©pisode, nous parlons de la sortie de la version 1.0 de Polars, de Smart Data, de la gestion du cycle de vie des donnĂ©es avec les Data Vaults sur Snowflake, de gestion logique des donnĂ©es et de la preview du plugin BigQuery JupyterLab. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Polars version 1.0 đ Smart Data đ Gestion du cycle de vie des donnĂ©es avec Data Vault sur Snowflake | |||
| Data Reliability et BigQuery Datasream : les clés pour vos données ! | 29 Jun 2024 | 00:50:23 | |
âïž Dans cet Ă©pisode, nous parlons de Data Reliability, de CI/CD pour les Data Engineers, de l'utilisation du mode "append-only" de Datasream sur BigQuery et des tendances et opportunitĂ©s actuelles en data. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ L'utilisation du mode "append-only" de Datasream sur BigQuery đ Data Reliability | |||
| LakeFlow et Unity Catalog Open Source : les nouveautés de Databricks | 23 Jun 2024 | 00:35:09 | |
âïž Dans cet Ă©pisode, nous parlons de la disponibilitĂ© de LakeFlow sur Databricks, du package python Daft, de la mise en Open Source de Unity Catalog de Databricks, du rĂŽle du DPU dans lâinformatique, de la future sortie de la version 2.0 de Numpy. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ La disponibilitĂ© de LakeFlow de Databricks đ La mise en Open Source de Unity Catalog de Databricks | |||
| Gaël Lemaux sur les Snowflake Dynamic Tables et DuckDB 1.0 : la Data Engineering continue d'évoluer | 16 Jun 2024 | 00:55:50 | |
âïž Dans cet Ă©pisode, nous parlons de Dynamics Tables sur Snowflake vs ETL/ELT, la sortie de la version 1.0.0 de DuckDB, l'intĂ©gration dâAmazon OpenSearch Service avec Amazon S3, le support de Delta Lake dans BigQuery et Variant Data Type dans Databricks. đ€© Nous avons Ă©galement un nouvel invitĂ© cette semaine qui est l'auteur d'un article sur les Dynamics Tables : GaĂ«l Lemaux. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ GaĂ«l sur LinkedIn đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Les Dynamics Table sur Snowflake avec GaĂ«l Lemaux đ La sortie de la version 1.0.0 de DuckDB đ L'intĂ©gration d'Amazon OpenSeach Service avec Amazon S3 đ Le support de Delta Lake dans BigQuery đ Databricks sort un nouveau format de donnĂ©es : Variant | |||
| Florent Jakubowski sur ETL vs ELT et lâĂ©volution des rĂŽles en Data Engineering | 07 Jun 2024 | 01:09:16 | |
âïž Dans cet Ă©pisode, nous parlons de l'ETL vs ELT, du rĂŽle d'Analytics Engineer, de l'interprĂ©teur RustPython, du package python SQLFrame et de l'utilisation du RAG pour gĂ©nĂ©rer du SQL. đ€© Nous avons Ă©galement un invitĂ© qui est l'auteur d'un post LinkedIn dĂ©taillĂ© sur la comparaison entre ETL et ELT : Florent Jakubowski. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Florent sur LinkedIn đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Les diffĂ©rences dâaujourdâhui entre ETL et ELT avec Florent Jakubowski đ L'interprĂ©teur RustPython đ Le rĂŽle d'Analytics Engineer | |||
| 50 ans de SQL et Liquid Clustering : les nouveautés et réflexions en Data Engineering | 31 May 2024 | 01:02:03 | |
âïž Dans cet Ă©pisode, nous parlons des diffĂ©rents types de stockage, de Data Quality Management, de la disponibilitĂ© gĂ©nĂ©rale du Liquid Clustering sur Databricks, des 50 ans du SQL, de contrĂŽle des coĂ»ts sur Dataflow et du dictionnaire de donnĂ©es vs le catalogue de donnĂ©es. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Les diffĂ©rents types de stockage đ Les 50 ans du SQL đ DisponibilitĂ© gĂ©nĂ©rale du Liquid Clustering sur Databricks đ Le Data Quality Management | |||
| SQL automatisé, BigQuery Jobs Explorer et PostgreSQL 17 : les nouveautés à connaßtre | 05 Oct 2024 | 00:57:04 | |
âïž Dans cet Ă©pisode, nous parlons de la gĂ©nĂ©ration automatisĂ©e de requĂȘtes SQL, de la prĂ©sentation de BigQuery jobs explorer, de lâintĂ©gration de PyCharm avec Databricks, de bonnes pratiques en SQL et de la sortie de PostgreSQL 17 ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ La gĂ©nĂ©ration automatisĂ©e de requĂȘtes SQL đ La prĂ©sentation de BigQuery jobs explorer đ LâintĂ©gration de PyCharm avec Databricks đ Les bonnes pratiques en SQL đ La sortie de PostgreSQL 17 | |||
| dbt 1.8, Pandas vs Polars et réduction des coûts sur Snowflake : décryptage | 31 May 2024 | 00:32:29 | |
âïž Pour ce premier Ă©pisode, nous parlons de la version 1.8 de dbt, de rĂ©duction des coĂ»ts sur Snowflake, de Pandas vs Polars et de Python sur SQL Server. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data et dĂ©coulant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ DBT version 1.8 đ RĂ©duction des coĂ»ts sur Snowflake đ Pandas vs Polars đ Python sur SQL Server | |||
| Pipe Syntax en SQL, Apache Iceberg et IA générative : vers une Data Engineering plus simple ? | 27 Sep 2024 | 00:57:11 | |
âïž Dans cet Ă©pisode, nous parlons de lâimportance de la Data Engineering dans lâIA gĂ©nĂ©rative, de la Pipe Syntax en SQL, de Data Observability, de la dĂ©perdition du Data Modeling et de cas dâusage dâApache Iceberg dans Snowflake. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ Lâimportance de la Data Engineering dans lâIA gĂ©nĂ©rative đ La Pipe Syntax en SQL đ Data Observability đ La dĂ©perdition du Data Modeling đ Des cas dâusage dâApache Iceberg dans Snowflake | |||
| Uber dans le cloud, DuckDB 1.1.0 et Pandas sur Snowflake : les annonces marquantes | 21 Sep 2024 | 00:39:18 | |
âïž Dans cet Ă©pisode, nous parlons de la migration de Uber vers le cloud, de la sortie de DuckDB 1.1.0, de la sortie de Airbyte 1.0, de la classification des Data Engineers en trois groupes et de la disponibilitĂ© de Pandas sur Snowflake. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ La migration de Uber vers le cloud ; đ La sortie de DuckDB 1.1.0 ; đ La sortie de Airbyte 1.0 ; đ La classification des Data Engineers en trois groupes ; đ La disponibilitĂ© de Pandas sur Snowflake. | |||
| Uber, IA et Data Governance : les enjeux critiques de la data d'aujourdâhui | 15 Sep 2024 | 00:58:44 | |
âïž Dans cet Ă©pisode, nous parlons du retour d'Elasticsearch en Open Source, des risques des dĂ©cisions basĂ©es uniquement sur la Data, de l'utilisation des rĂ©sultats d'une procĂ©dure stockĂ©e dans un SELECT sur Snowflake, des tendances de la Data Engineering avec l'IA et de Data Governance et 324 millions d'amende pour Uber đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Blog de Bertrand Articles đ Le retour d'Elasticsearch en Open Source đ Les risques des dĂ©cisions basĂ©es uniquement sur la Data đ Utilisation des rĂ©sultats d'une procĂ©dure stockĂ©e dans un SELECT sur Snowflake đ Les tendances de la Data Engineering avec l'IA đ Data Governance et 324 millions d'amende pour Uber | |||
| BigQuery Vector Search et Ray chez Amazon : les clés du changement ? | 09 Sep 2024 | 00:16:54 | |
âïž Dans cet Ă©pisode, je parle de ScaNN sur BigQuery Vector Search, des nouveautĂ©s de Databricks Workflows, de InstantDB, de tables de faits et de dimensions et de migration dâApache Spark vers Ray chez Amazon. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Preview de lâalgorithme ScaNN sur BigQuery Vector Search đ Les nouveautĂ©s de Databricks Worklfows đ PrĂ©sentation de InstantDB utilisĂ© dans Notion ou Figma đ Les tables de faits et de dimension đ Explication de la migration dâApache Spark vers Ray chez Amazon | |||
| SQL avec Python, Airflow 2.10.0 et Vector Search : les tendances data du moment | 01 Sep 2024 | 00:11:25 | |
âïž Dans cet Ă©pisode, je parle de lâutilisation de SQL avec python, de Apache Iceberg vs Apache Hudi, la preview du Vector Search sur MariaDB, la sortie de la version 2.10.0 dâAirflow et sur les diffĂ©rents niveaux de Data Engineers et Software Engineers đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Utilisation de SQL avec Python đ Apache Iceberg vs Apache Hudi đ Preview de Vector Search sur MariaDB đ Apache Airflow 2.10.0 đ Les niveaux de Data et Software Engineer | |||
| BigQuery Continuous Queries et Cloud SQL Studio : toujours plus de nouveautés ! | 19 Aug 2024 | 00:12:47 | |
âïž Dans cet Ă©pisode, je parle de Data Engineering vs Software Engineering, de Cloud SQL Studio, des fonctions dâagrĂ©gat personnaliĂ©es en python sur Snowflake, de BigQuery Continuous Queries et de recommandations pour la rĂ©solution de problĂšmes de Data Engineering. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. Pendant le mois d'aoĂ»t, je serai seul pour animer le podcast. đ Axel sur LinkedIn đ Bertrand sur LinkedIn Articles đ Est-ce que la Data Engineering est du Software Engineering ? đ DisponibilitĂ© gĂ©nĂ©rale de Cloud SQL Studio sur GCP đ DisponibilitĂ© des fonctions dâagrĂ©gat customisĂ©es en python sur Snowflake đ Sortie en preview de BigQuery Continuous Queries đ Recommandations pour rĂ©soudre des problĂšmes de Data Engineering | |||
| Kafka 3.8 et Data Lake CDC : ce que les Data Engineers doivent savoir | 11 Aug 2024 | 00:18:34 | |
âïž Dans cet Ă©pisode, je parle de la sortie dâApache Kafka 3.8.0, de menaces cachĂ©es dans un Data Warehouse, de lâavenir des hyperscalers et des data centers, de simplicitĂ© et de composabilitĂ© en Data Engineering, et de Data Lake Change Data Capture.
đïž DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
Pendant le mois d'août, je serai seul pour animer le podcast.
đ Axel sur LinkedIn
đ Bertrand sur LinkedIn
đ Apache Kafka 3.8.0 đ Menaces cachĂ©es dans un Data Warehouse đ L'avenir entre hyperscalers et datacenters locaux đ La simplicitĂ© et la composabilitĂ© en Data Engineering | |||
| 575K$ comme Staff Data Enginneer chez Airbnb ! Ses conseils pour décrocher ce poste | 06 Dec 2024 | 00:58:04 | |
âïž Dans cet Ă©pisode, nous parlons de Microsoft Drasi, de la bascule de lâELT vers lâesprit Graphe, de la tendance Ă utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering, des conseils de prĂ©paration dâentretien pour un post de Staff Data Engineer chez Airbnb Ă 575K$ et les tendances 2025 pour la Data Engineering et lâIA. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ Microsoft Drasi pour la gestion des donnĂ©es en streaming đ La bascule de lâELT vers lâesprit Graphe đ La tendance Ă utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering đ La prĂ©paration dâentretien pour un post de Staff Data Engineer chez Airbnb đ Les tendances 2025 pour la Data Engineering et lâIA | |||
| De lâincrĂ©mental au Data Product en passant par l'IA : ce qui redĂ©finit le Data Engineering | 29 Nov 2024 | 00:54:09 | |
âïž Dans cet Ă©pisode, nous parlons de la montĂ©e des traitements incrĂ©mentaux et lâimpact sur la Data Quality, des Data Products pour amĂ©liorer la Data Quality des traitements incrĂ©mentaux, des Data Rooms Virtuelles, des diffĂ©rents design de pipelines de donnĂ©es, de Snowflake Intelligence et ses agents de donnĂ©es ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â â â â Axel sur LinkedInâ â â â đ â â â â Bertrand sur LinkedIn â â â â â â â â â Newsletter de Bertrandâ â â â â â â â â Blog de Bertrandâ â Articles đ La montĂ©e des traitements incrĂ©mentaux et lâimpact sur la Data Quality đ Les Data Products pour amĂ©liorer la Data Quality des traitements incrĂ©mentaux đ Les Data Rooms Virtuelles đ Les diffĂ©rents design de pipelines de donnĂ©es đ Snowflake Intelligence et ses agents de donnĂ©es | |||
| Les stratégies data de Netflix, Meta, Spotify, Airbnb et Uber révélées ! | 22 Nov 2024 | 01:06:00 | |
âïž Dans cet Ă©pisode, nous parlons des donnĂ©es synthĂ©tiques pour des donnĂ©es sĂ©curisĂ©es avec lâIA, des rĂšgles de base et des rĂšgles mĂ©tier dans la DataQuality, sur le besoin dâutiliser les bons tests dans un projet dbt, des Data Silos et des architectures de Data Engineering utilisĂ©es par Netflix, Uber, Spotify, Meta et Airbnb ; đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â â â Axel sur LinkedInâ â â đ â â â Bertrand sur LinkedIn â â â â â â â Newsletter de Bertrandâ â â â â â â Blog de Bertrandâ â Articles đ Des donnĂ©es synthĂ©tiques pour des donnĂ©es sĂ©curisĂ©es avec lâIA đ Les rĂšgles de base et les rĂšgles mĂ©tier dans la DataQuality đ Le besoin dâutiliser les bons tests dans un projet dbt đ Les Data Silos đ Les architectures de Data Engineering utilisĂ©es par Netflix, Uber, Spotify, Meta et Airbnb | |||
| Data Engineer 2.0 : clustering, IA, et plan pour 2025 | 15 Nov 2024 | 01:09:41 | |
âïž Dans cet Ă©pisode, nous parlons des clĂ©s de clustering sur Snowflake, du rĂŽle de lâAI Data Engineer, de la disponibilitĂ© des vues matĂ©rialisĂ©es et des tables de streaming pour AWS et Azure, de la planification de fin dâannĂ©e pour les objectifs 2025 et de lâutilisation du streaming de donnĂ©es pour le dĂ©veloppement des futurs services financiers ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â â Axel sur LinkedInâ â đ â â Bertrand sur LinkedIn â â â â â Newsletter de Bertrandâ â â â â Blog de Bertrandâ â Articles đ Les clĂ©s de clustering sur Snowflake đ Le rĂŽle de lâAI Data Engineer đ La disponibilitĂ© des vues matĂ©rialisĂ©es et des tables de streaming pour AWS et Azure đ La planification de fin dâannĂ©e pour les objectifs 2025 đ Lâutilisation du streaming de donnĂ©es pour le dĂ©veloppement des futurs services financiers | |||
| Le premier Data Engineer IA et la surveillance des pipelines : décryptage | 08 Nov 2024 | 01:06:49 | |
âïž Dans cet Ă©pisode, nous parlons de lâorganisation des Ă©quipes logiciel et data, des trois composants dâune stack de donnĂ©es non structurĂ©es, de la stratĂ©gie de surveillance des pipelines ETL, du premier data Engineer IA au monde et de la rĂ©alitĂ© des formats de tables ouverts ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â Bertrand sur LinkedIn â â â Newsletter de Bertrandâ Articles : đ â Lâorganisation des Ă©quipes logiciel et dataâ đ â Les trois composants dâune stack de donnĂ©es non structurĂ©esâ đ â La stratĂ©gie de surveillance des pipelines ETLâ | |||
| Data Mesh, Data Owner et la fin des clés primaires : ce que vous devez savoir | 01 Nov 2024 | 01:14:14 | |
âïž Dans cet Ă©pisode, nous parlons de la mort des clĂ©s primaires et Ă©trangĂšres, de lâimplĂ©mentation du Data Mesh chez Roche, du Github Actions pour la Data Engineering, de la Data Stack dĂ©clarative et du rĂŽle de Data Owner ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ La mort des clĂ©s primaires et Ă©trangĂšres đ La Data Observability lors de lâimplĂ©mentation du Data Mesh chez Roche đ Github Actions pour la Data Engineering đ La Data Stack dĂ©clarative đ Le rĂŽle de Data Owner | |||
| BigQuery, dbt v1.9 et Data Quality : les stratégies qui transforment la donnée | 25 Oct 2024 | 00:48:58 | |
âïž Dans cet Ă©pisode, nous parlons des stratĂ©gies innovantes en Data Engineering, de la preview des datasets externes entre BigQuery et Spanner, de la preview des tables BigQuery pour Apache Iceberg, du micro batch incremental models de la v1.9 de dbt, du Data Quality Management ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ Les stratĂ©gies innovantes en Data Engineering đ La preview des datasets externes entre BigQuery et Spanner đ La preview des tables BigQuery pour Apache Iceberg đ Le micro batch incremental models de la v1.9 de dbt đ Data Quality Management | |||
| Data Engineer, ça craint ou pas ? | 24 Mar 2025 | 00:57:01 | |
âïž Dans cet Ă©pisode, nous parlons des nouveautĂ©s de Databricks SQL de fĂ©vrier 2025, du rachat de DataStax par IBM pour renforcer watsonx et l'IA gĂ©nĂ©rative, de la sortie d'Apache Beam 2.63.0, des graphiques d'utilisation des ressources BigQuery, du rĂ©examen du GROUP BY ROLLUP avec un exemple plus rĂ©aliste, des difficultĂ©s du mĂ©tier de Data Engineer et de l'Ă©tat actuel de l'architecture Lakehouse. đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â â â Axel sur LinkedInâ â â đ â â â Bertrand sur LinkedInâ â â â â â â Newsletter de Bertrandâ â â â â â â Blog de Bertrandâ â Articlesâ đ Graphiques d'utilisation des ressources BigQuery đ The State of Lakehouse Architectuređ IBM rachĂšte DataStax pour renforcer watsonx et l'IA gĂ©nĂ©rativeđ Etre Data Engineer ça craintđ Apache Beam 2.63.0 đ NouveautĂ©s de Databricks SQL, fĂ©vrier 2025 đ RĂ©examen du GROUP BY ROLLUP avec un exemple plus rĂ©aliste | |||
| La disparition des Data Engineers ! | 01 Mar 2025 | 00:48:23 | |
âïž Dans cet Ă©pisode, nous parlons de l'acquisition de Voyage AI par MongoDB, de l'exĂ©cution des LLM open-source sur BigQuery ML, de l'acquisition d'Upsolver par Qlik, de la levĂ©e de fonds de 47 millions de dollars par Prophecy, de l'optimisation du moteur vectoriel d'OpenSearch, de la mĂ©thode pour simplifier votre code Python avec l'opĂ©rateur walrus, l'avenir du mĂ©tier de Data Engineer face aux IA et l'avenir des donnĂ©es non structurĂ©es dans le Data Engineering. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â â Axel sur LinkedInâ â đ â â Bertrand sur LinkedInâ â â â â Newsletter de Bertrandâ â Articles đ MongoDB annonce l'acquisition de Voyage AI pour permettre aux organisations de construire des applications dâIA fiables â đ Prophecy lĂšve 47 millions de dollars de fonds đ Optimisation du moteur vectoriel d'OpenSearch â đ Les Data Engineers vont ils devenirs obsolĂštes ? đ Les donnĂ©es non structurĂ©es sont l'avenir du Data Engineering | |||
| Les outils essentiels du Data Engineer ! 500Mds$ dans la data đ° | 04 Feb 2025 | 00:43:33 | |
âïž Dans cet Ă©pisode, nous parlons du rachat de SDF par dbt, du plan de Donald Trump de 500 milliards de $ pour l'IA, des outils essentiels en Data Engineering et de l'architecture des pipelines de donnĂ©es chez BlaBlaCar. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â Axel sur LinkedInâ đ â Bertrand sur LinkedInâ â â Newsletter de Bertrandâ â â Blog de Bertrand Articles đ Tobiko - dbt + SDF : Ce qui change et ce qui ne change pas đ Donald Trump annonce son plan de 500 milliards de $ pour l'IA đ Architecture des pipelines de donnĂ©es chez BlaBlaCar đ La boĂźte Ă outils en Data Engineering : Les Outils essentiels | |||
| Shift Left, la data change de responsable ! | 01 Apr 2025 | 00:17:30 | |
âïž Dans cet Ă©pisode, nous parlons de l'annonce de la prise en charge de Git dans BigQuery, du lancement de dbt copilot pour amĂ©liorer lâefficacitĂ© des dĂ©veloppeurs, du Shift Left, du Sommet Databricks Data + AI 2025, et de l'investissement de Snowflake Ventures dans DataOps.live.đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â â â â Axel sur LinkedInâ â â â đ â â â â Bertrand sur LinkedInâ â â â â â â â â Newsletter de Bertrandâ â â â â â â â â Blog de Bertrandâ â Articlesđ Annonce des dĂ©pĂŽts BigQuery đ DBT Labs lance un copilote d'IA đ Databricks Data + AI 2025 đ Snowflake Ventures investit dans DataOps.live đ Le Manifeste des donnĂ©es de Shift Left | |||