Les fondamentaux d’analyse de données avec R
Bénéficier d’une culture statistique n’a peut-être jamais été aussi nécessaire qu’aujourd’hui dans les business. De la reconnaissance d’image automatique sur Facebook aux chiffres du chômage, des sondages d’opinion à la détection des ondes gravitationnelles, les données et leurs interprétations font désormais partie de nos sociétés modernes. Considéré depuis quelques années comme le logiciel le plus complet et puissant pour l’analyse statistique avancée de données, R dispose aujourd’hui d’une large communauté d’utilisateurs. Fidèles à la philosophie Open Source, ils ont peu à peu créé et mis à disposition des extensions réutilisables qui permettent par exemple de se connecter aisément à des bases de données ou encore qui proposent des modèles d’analyses spécifiquement adaptés à des domaines particuliers (ingénierie, finance quantitative, sociologie, économie, marketing, …). Cette formation de premier niveau sur R permettra aux participants de créer leurs premières analyses statistiques et d’apprendre à les restituer sous forme graphique.
L’objectif de cette formation est de fournir les bases d’une compréhension critique des données et de leur interprétation. Pour ce faire, nous tirerons parti de deux approches :
- Nous consacrerons une bonne partie de la formation à l’étude de notions statistiques de base : corrélation, causalité, inférence, test d’hypothèse, etc. Ces notions seront abordées non pas à travers le prisme du formalisme mathématique, mais de la compréhension intuitive des techniques employées. Nous joindrons la théorie à la pratique, en travaillant sur une petite enquête qui sera produite de A à Z par les participants à la formation.
- Nous apporterons également les éclairages produits par les sciences sociales et du management sur ce qu’il convient d’appeler la quantification : peut-on percevoir la « réalité » à travers des catégories statistiques ?