Passer au contenu
Mon compte
Wishlist
Panier 00:00

Modélisation prédictive et Apprentissage statistique avec R

1.0

(1)

Audience : Adulte - Haut niveau
Le Pitch
Présentation de l'éditeur Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. Stéphane TUFFÉRY est docteur en mathématiques. En charge de la statistique et du data mining dans un grand groupe bancaire français, il enseigne le data mining à l'université Rennes 1 à l'ISUP (Institut de Statistique de l'Université de Paris). Il a également publié "Étude de cas en statistique décisionnelle" dans la même collection. Extrait Extrait de l'avant-propos Cet ouvrage explique et met en oeuvre les principales méthodes de modélisation d'une situation dans laquelle on recherche la prédiction d'une variable binaire à l'aide de variables qualitatives ou quantitatives. Cette situation est très fréquente en data mining et en statistique, et elle est à la base entre autres des algorithmes de scoring. Nous le ferons à l'aide du logiciel libre R sur la base d'une étude de cas. Nous avons choisi ce logiciel, parce qu'il est aujourd'hui le plus répandu chez les statisticiens et les data scientists, et aussi en raison de la richesse et de la variété sans égales de ses fonctionnalités, couvertes par des modules appelés «packages» (ou «paquets»), au nombre de plus de six mille au moment où nous écrivons ces lignes. De plus, les ressources consacrées à R sur Internet et dans la littérature statistique sont innombrables et permettent de trouver la réponse à presque n'importe quelle question. Pour aider le lecteur, nous avons indiqué quelques références dans la bibliographie en fin d'ouvrage. Les méthodes présentées ici couvrent le champ de la statistique, mais aussi de ce qui dans la terminologie Afficher moinsAfficher plus

Modélisation prédictive et Apprentissage statistique avec R

1.0

(1)

24,45 €
45,00 € -45%
Sélectionnez la condition
 
Il ne reste plus que 1 exemplaire(s) en stock
24,45 €
45,00 € -45%

Le Pitch

Présentation de l'éditeur Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. Stéphane TUFFÉRY est docteur en mathématiques. En charge de la statistique et du data mining dans un grand groupe bancaire français, il enseigne le data mining à l'université Rennes 1 à l'ISUP (Institut de Statistique de l'Université de Paris). Il a également publié "Étude de cas en statistique décisionnelle" dans la même collection. Extrait Extrait de l'avant-propos Cet ouvrage explique et met en oeuvre les principales méthodes de modélisation d'une situation dans laquelle on recherche la prédiction d'une variable binaire à l'aide de variables qualitatives ou quantitatives. Cette situation est très fréquente en data mining et en statistique, et elle est à la base entre autres des algorithmes de scoring. Nous le ferons à l'aide du logiciel libre R sur la base d'une étude de cas. Nous avons choisi ce logiciel, parce qu'il est aujourd'hui le plus répandu chez les statisticiens et les data scientists, et aussi en raison de la richesse et de la variété sans égales de ses fonctionnalités, couvertes par des modules appelés «packages» (ou «paquets»), au nombre de plus de six mille au moment où nous écrivons ces lignes. De plus, les ressources consacrées à R sur Internet et dans la littérature statistique sont innombrables et permettent de trouver la réponse à presque n'importe quelle question. Pour aider le lecteur, nous avons indiqué quelques références dans la bibliographie en fin d'ouvrage. Les méthodes présentées ici couvrent le champ de la statistique, mais aussi de ce qui dans la terminologie Afficher moinsAfficher plus

Détails du livre

Titre complet
Modélisation prédictive et Apprentissage statistique avec R
Format
Grand Format
Publication
01 février 2015
Audience
Adulte - Haut niveau
Pages
415
Taille
24 x 17 x 2.5 cm
Poids
740
ISBN-13
9782710811589

Auteur

Translation missing: fr.product.general.delivery.delivered_between : 4 février - 7 février
Translation missing: fr.product.general.delivery.vendor.supplier
Translation missing: fr.product.general.delivery.vendor.print
Translation missing: fr.product.general.delivery.vendor.stock
Translation missing: fr.product.general.delivery.at_home_between :
Les délais de livraison ont tendance à s'accélérer ces dernières semaines, le temps indiqué peut être plus court que prévu. Les délais de livraison ont tendance à s'allonger ces dernières semaines, le temps indiqué peut être plus long que prévu.
Translation missing: fr.product.general.delivery.info_used
Retour GRATUIT sous 14 jours.
Image to render

Revendez-le sur notre application!

Aller plus loin

Vous pouvez également aimer

Récemment consultés