La Data Science Expliquée – Détails, épisodes et analyse

Détails du podcast

Informations techniques et générales issues du flux RSS du podcast.

La Data Science Expliquée

La Data Science Expliquée

UR4NVS

Sciences

Fréquence : 1 épisode/30j. Total Éps: 12

Spotify for Podcasters
La Data science Expliquée est une série de podcasts animée par UR4NVS qui a pour but de vulgariser la science des données et de la rendre accessible. Cette série de podcasts permettra également de réfléchir sur divers sujets concernant la science des données, notamment sur des aspects d'éthique ou de vie privée.
Site
RSS
Apple

Classements récents

Dernières positions dans les classements Apple Podcasts et Spotify.

Apple Podcasts

  • 🇫🇷 France - science

    22/11/2024
    #93
  • 🇫🇷 France - science

    23/10/2024
    #86

Spotify

    Aucun classement récent disponible



Qualité et score du flux RSS

Évaluation technique de la qualité et de la structure du flux RSS.

See all
Qualité du flux RSS
À améliorer

Score global : 38%


Historique des publications

Répartition mensuelle des publications d'épisodes au fil des années.

Episodes published by month in

Derniers épisodes publiés

Liste des épisodes récents, avec titres, durées et descriptions.

See all

Mesurer la performance avec les métriques

Épisode 12

dimanche 21 novembre 2021Durée 07:02

La tâche finale dans la construction d'un modèle de machine learning est l'évaluation avec les métriques telles que la précision, le rappel et la f-mesure. Des graphiques exploitant ces métriques existent et pour les amateurs de tableaux de nombres, les matrices de confusion existent également. Vous vous familiarisez aussi avec les notions de vrais positifs, faux positifs, vrais négatifs et faux négatifs dans ce podcast.


Matrice de confusion : https://fr.wikipedia.org/wiki/Matrice_de_confusion

Précision-rappel : https://fr.wikipedia.org/wiki/Pr%C3%A9cision_et_rappel

Courbe ROC : https://fr.wikipedia.org/wiki/Courbe_ROC


Représentations graphiques (scikit-learn.org) : 

Matrice de confusion = https://scikit-learn.org/stable/auto_examples/miscellaneous/plot_display_object_visualization.html#create-confusionmatrixdisplay

Courbe Précision-rappel = https://scikit-learn.org/stable/auto_examples/miscellaneous/plot_display_object_visualization.html#create-precisionrecalldisplay

Courbe ROC  = https://scikit-learn.org/stable/auto_examples/miscellaneous/plot_display_object_visualization.html#create-roccurvedisplay


La validation croisée

Épisode 11

samedi 20 novembre 2021Durée 03:08

On peut très bien obtenir un bon score de notre algorithme mais est-il vraiment aussi bon dans la réalité ? La validation permet de répondre à cette question en utilisant des méthodes bien spécifiques pour les jeux d'apprentissage et de test. Différents algorithmes seront présentés ainsi que leur utilisation spécifique aux situations.


Validation croisée (Wikipédia) : https://fr.wikipedia.org/wiki/Validation_crois%C3%A9e

"Intelligence" Artificielle

Épisode 2

samedi 10 avril 2021Durée 02:26

Le mot Intelligence Artificielle est partout et utilisé à outrance. Dans ce court podcast, je vous explique en quoi le mot "Intelligence Artificielle" est erroné ainsi que mes réflexions concernant un nouveau terme, plus juste, pour remplacer "Intelligence Artificielle".

Le Machine Learning

Épisode 1

mercredi 30 décembre 2020Durée 08:18

J'aborde dans ce premier épisode le Machine Learning, partie intégrante de la science des données. Vous aurez une vision de la création d'un modèle de Machine Learning ainsi qu'un peu d'histoire.

Regarder vers l'avenir et vers le feature engineering

Épisode 10

vendredi 19 novembre 2021Durée 06:16

Feature engineering, cette méthode permettant de traiter les jeu de données est considérer comme l'avenir des data scientist. Face à une montée croissante de l'automatisation, le feature engineering restera le domaine où l'humain fait toute la différence. Découvrez comment dans ce podcast !


Exemple de feature engineering en Python : https://scikit-learn.org/stable/auto_examples/applications/plot_cyclical_feature_engineering.html

XGBoost ou booster un arbre

Épisode 9

jeudi 18 novembre 2021Durée 04:52

Parlons aujourd'hui de XGBoost, algorithme d'arbre de décision mondialement connu et créé initialement en 2014 par Tianqi Chen. Il s'illustre par une méthode bien particulièrement pour produire autant de succès. Mais intéressons nous aussi aux arbres, forêt de décisions et aux renforcement par gradient.


XGBoost (Wikipedia) : https://en.wikipedia.org/wiki/XGBoost

XGBoost (site officiel) : https://xgboost.ai/

Exporter et miniaturiser

Épisode 8

mercredi 17 novembre 2021Durée 03:28

Après avoir produit un algorithme de machine learning, pour le mettre en production il faut pouvoir l'intégrer à des machines moins puissantes. impossible de le ré-entraîner sur celles-ci mais fort heureusement il existe des solutions. Le physicien Erwin Schrödinger se demandait : "comment peut-on expliquer à l'aide de la  physique et de la chimie le événements qui se produisent dans l'espace  et dans le temps dans les limites spatiales d'un organisme vivant ?" et moi je vais tenter de vous expliquer ce phénomène appliqué au machine learning : comment intégrer des algorithmes conçus sur supercalculateurs dans nos téléphones ?


TensorFlow : https://www.tensorflow.org/

TensorFlow Lite : https://www.tensorflow.org/lite/

Core ML : https://developer.apple.com/documentation/coreml

PMML : http://dmg.org/pmml/v4-4-1/GeneralStructure.html

pickle : https://docs.python.org/3/library/pickle.html

FaceID : une fonction au goût de révolution

Épisode 7

mardi 16 novembre 2021Durée 03:50

Comment fonctionne la technologie FaceID d'Apple ? A travers un décryptage du fonctionnement issu de brevets, j'essaie de répondre à cette question par mes compétences afin de vous donner un regard technique sur cette technologie, que j'estime révolutionnaire.


Brevet de FaceID : https://patents.google.com/patent/US8384997B2/en?oq=US8384997

Apple sur la confidentialité de FaceID : https://support.apple.com/fr-fr/HT208108

Le clustering

Épisode 6

lundi 15 novembre 2021Durée 08:50

Clustering fait référence aux mot que vous connaissez bien tous maintenant : cluster. Aujourd'hui partez à la découverte du clustering, une méthode très utile en science des données. J'évoquerai ses différentes formes et pourquoi il est utile de faire du clustering.


K-moyennes : https://fr.wikipedia.org/wiki/K-moyennes

DBSCAN : https://fr.wikipedia.org/wiki/DBSCAN

Scikit-learn : https://scikit-learn.org/stable/

Scipy : https://scipy.org/

Algorithmes révélateurs de notre société

Épisode 5

samedi 13 novembre 2021Durée 04:43

On entend de plus en plus parler des algorithmes sexistes ou racistes. Mais est-il bon de pointer du doigt les algorithmes ou faut-il savoir introspecter la société pour trouver la vérité ? Réponse dans ce podcast !

Enquête ISM Corum : https://dares.travail-emploi.gouv.fr/publications/discrimination-a-l-embauche-selon-l-origine-que-nous-apprend-le-testing-aupres


Podcasts Similaires Basées sur le Contenu

Découvrez des podcasts liées à La Data Science Expliquée. Explorez des podcasts avec des thèmes, sujets, et formats similaires. Ces similarités sont calculées grâce à des données tangibles, pas d'extrapolations !
Génération Do It Yourself
Thinking Elixir Podcast
ШоПоКо
Signals and Threads
Syntax - Tasty Web Development Treats
Latent Space: The AI Engineer Podcast
Data Engineering Podcast
The Stack Overflow Podcast
FOSS and Crafts
David Bombal
© My Podcast Data