DataWatch – Détails, épisodes et analyse
Détails du podcast
Informations techniques et générales issues du flux RSS du podcast.


🎙️ DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en Data et particulièrement en Data Engineering.
Classements récents
Dernières positions dans les classements Apple Podcasts et Spotify.
Apple Podcasts
Aucun classement récent disponible
Spotify
Aucun classement récent disponible
Liens partagés entre épisodes et podcasts
Liens présents dans les descriptions d'épisodes et autres podcasts les utilisant également.
See allQualité et score du flux RSS
Évaluation technique de la qualité et de la structure du flux RSS.
See allScore global : 73%
Historique des publications
Répartition mensuelle des publications d'épisodes au fil des années.
Décathlon déploie Polars en prod !
Saison 1 · Épisode 41
mardi 23 décembre 2025 • Durée 39:12
☝️ Dans cet épisode, Bertrand et Axel discutent de l'utilisation de Polars chez Decathlon, de la comparaison entre Polars et Spark, de Lance comme nouveau format de données, et de l'impact de l'IA sur l'observabilité des données avec Monte Carlo. Ils explorent comment ces outils et technologies peuvent optimiser le traitement des données et améliorer l'efficacité des équipes data.
👉 Axel sur LinkedIn : https://www.linkedin.com/in/axel-mauroy-5699509a/
👉 Bertrand sur LinkedIn : https://www.linkedin.com/in/bertrandfabre/
➕ Newsletter de Bertrand : https://datayoka.notion.site/1355071ba1ca80189240d83808f5994d
➕ Blog de Bertrand : https://datayoka.com/blog
00:00 Introduction et présentation des sujets
00:58 Utilisation de Polars chez Décathlon
08:48 Comparaison entre Polars et Spark
16:33 Lance : un nouveau format de données
27:54 Monte Carlo et l'IA pour l'observabilité
Python 3.14, vraiment mieux ?
Saison 1 · Épisode 40
mardi 18 novembre 2025 • Durée 31:30
☝️ Dans cet épisode, Bertrand et Axel explorent les nouveautés de Python 3.14, notamment le T-String, les améliorations de débogage, et les implications du GIL sur les performances. Ils discutent également des concepts de Data Redaction et Data Masking, ainsi que des meilleures pratiques pour la gestion des données sensibles.
🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.
Liens vers les articles :
👉 Les nouveautés de Python 3.14 : https://www.docstring.fr/blog/les-nouveautes-de-python-314/
👉 Data redaction vs. data masking: What's the difference? : https://www.rudderstack.com/blog/data-redaction-vs-data-masking
00:00 Introduction au Data Engineering et Python 3.14
02:00 Les nouveautés de Python 3.14 : T-String et F-String
06:13 Améliorations de débogage et annotations différées
09:06 Le GIL et ses implications sur les performances
10:57 Just-In-Time et multi-interpréteur dans Python
16:09 Nouvelles fonctionnalités de compression et gestion des erreurs
18:37 Data Redaction vs Data Masking : Concepts et applications
27:52 Conclusion et réflexions sur la conformité des données
SQL avec Python, Airflow 2.10.0 et Vector Search : les tendances data du moment
Saison 1 · Épisode 14
dimanche 1 septembre 2024 • Durée 11:25
☝️ Dans cet épisode, je parle de l’utilisation de SQL avec python, de Apache Iceberg vs Apache Hudi, la preview du Vector Search sur MariaDB, la sortie de la version 2.10.0 d’Airflow et sur les différents niveaux de Data Engineers et Software Engineers 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles 👉 Utilisation de SQL avec Python 👉 Apache Iceberg vs Apache Hudi 👉 Preview de Vector Search sur MariaDB 👉 Apache Airflow 2.10.0 👉 Les niveaux de Data et Software Engineer
BigQuery Vector Search et Ray chez Amazon : les clés du changement ?
Saison 1 · Épisode 15
lundi 9 septembre 2024 • Durée 16:54
☝️ Dans cet épisode, je parle de ScaNN sur BigQuery Vector Search, des nouveautés de Databricks Workflows, de InstantDB, de tables de faits et de dimensions et de migration d’Apache Spark vers Ray chez Amazon. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles 👉 Preview de l’algorithme ScaNN sur BigQuery Vector Search 👉 Les nouveautés de Databricks Worklfows 👉 Présentation de InstantDB utilisé dans Notion ou Figma 👉 Les tables de faits et de dimension 👉 Explication de la migration d’Apache Spark vers Ray chez Amazon
Cycle de vie du stockage : pourquoi cela peut transformer vos coûts data ?
Saison 1 · Épisode 11
dimanche 4 août 2024 • Durée 21:01
☝️ Dans cet épisode, je parle de 5 erreurs en Data Engineering, des bénéfices économiques dans la mise en place d’une politique de cycle de vie du stockage, de Snowflake Horizon, de l’utilisation de la simplicité pour résoudre les problèmes, et de différentes techniques de Data Modeling. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Pendant le mois d'août, je serai seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles
👉 5 erreurs en Data Engineering
👉 Les économies d’une politique de cycle de vie du stockage
👉 Snowflake Horizon pour une gouvernance unifiée
👉 L’utilisation de la simplicité pour résoudre les problèmes
Data Centers, souveraineté et qualité : les défis de la gestion des données
Saison 1 · Épisode 10
samedi 27 juillet 2024 • Durée 16:42
☝️ Dans cet épisode, nous parlons de souveraineté des données, de Exadata Exascale de Oracle, de Data Timeliness, de 3 étapes pour la mise en place de Data Quality et de la croissance des Data Centers. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. Cette semaine, je serai exceptionnellement seul pour animer le podcast. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles
dbt 1.8, Pandas vs Polars et réduction des coûts sur Snowflake : décryptage
Saison 1 · Épisode 1
vendredi 31 mai 2024 • Durée 32:29
☝️ Pour ce premier épisode, nous parlons de la version 1.8 de dbt, de réduction des coûts sur Snowflake, de Pandas vs Polars et de Python sur SQL Server. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles 👉 DBT version 1.8 👉 Réduction des coûts sur Snowflake 👉 Pandas vs Polars 👉 Python sur SQL Server
Identification des causes racines en Data Engineering
Saison 1 · Épisode 2
mardi 5 août 2025 • Durée 23:02
Dans cet épisode de DataWatch, Bertrand Fabre explore un article sur Monte Carlo, un outil de data quality et d'observabilité. Il partage ses réflexions sur les défis de la qualité des données, notamment la recherche des causes racines des anomalies, et discute des solutions possibles pour améliorer l'efficacité des équipes Data et IA.
👉 Bertrand sur LinkedIn
➕ Newsletter de Bertrand
Article :
Data Reliability et BigQuery Datasream : les clés pour vos données !
Saison 1 · Épisode 6
samedi 29 juin 2024 • Durée 50:23
☝️ Dans cet épisode, nous parlons de Data Reliability, de CI/CD pour les Data Engineers, de l'utilisation du mode "append-only" de Datasream sur BigQuery et des tendances et opportunités actuelles en data.
🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data et découlant du post LinkedIn du vendredi de Bertrand qui liste les articles en question. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn
Articles
👉 L'utilisation du mode "append-only" de Datasream sur BigQuery
70% de coûts en moins en utilisant Rust ?!
Saison 1 · Épisode 35
mardi 24 juin 2025 • Durée 17:10
☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre abordent des sujets clés de la Data Engineering, notamment Cloud Run, l'essor de Rust dans la Data Engineering, et les améliorations de BigQuery. Cloud Run se distingue par sa capacité à s'adapter rapidement aux besoins, tandis que Rust offre des performances supérieures et des économies de coûts significatives. BigQuery, quant à lui, évolue avec des techniques de vectorisation avancées pour optimiser la gestion des données.
🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.
Articles👉 Google Cloud Run propose des GPU sans serveur pour l'IA et le traitement par lots : 👉 L'essor de Rust dans l'ingénierie des données : 👉 Améliorations de gestion de données de BigQuery et de sa vectorisation




