|
La Statistique Descriptive est la branche des statistiques qui recueille des données, les analyse et présente les résultats sur des graphiques ou via le calcul de paramètres statistiques, c'est-à-dire de quelques chiffres visant à décrire l'ensemble des données. Malgré tout, dans de nombreux cas, il est impossible d'observer la valeur de la variable pour tous les éléments d'une population ; dans ce cas les données sont recueillies sur un échantillon, une portion de la population qui est utilisée pour obtenir des informations concernant les caractéristiques de la population totale. Cette situation est celle qui convient le mieux aux procédures expliquées dans ce chapitre.
Dans d'autres situations, les observations de la Statistique Descriptive correspondent à des valeurs observées pendant la réalisation d'une expérience aléatoire. Dans ce cas, l'échantillon de résultats a comme objectif d'essayer de rétablir le modèle théorique qui régit l'expérience.
Pour le travail sur les Statistiques wiris utilise toujours des nombres décimaux, contrairement aux autres domaines de connaissance, du fait qu'il respecte la pratique habituelle dans ce domaine.
Voici comment un échantillon de 3 zéros et de 4 uns peut être représenté.
Dans le premier cas, on a considéré une Liste qui contient les éléments de l'échantillon ; dans le second, on utilise un Diviseur où l'on indique combien de fois apparaît chaque valeur. Voici maintenant quelques opérations qui peuvent être effectuées avec des échantillons.
Pour terminer cette introduction, il faut ajouter que l'on peut regrouper différents échantillons de variables aléatoires avec un Diviseur. Cette possibilité est décrite en détail à
Multi_échantillon mais voici tout de suite quelques exemples explicatifs.
Cette section présente les fonctions que wiris peut appliquer à un ensemble de données observées d'une variable statistique, x={x1,x2,...,xn} Ces noms permettront de décrire les formules des différentes fonctions qui s'appliquent à un échantillon.
variance: commande variance
Calcule la variance conformément à la définition inférentielle. Autrement dit, étant n=longueur(x), m x=moyenne(x).
|
médiane: commande médiane
Si x1,x2,...,xn est ordonné, il se définit comme
| xk
|
si |
n=2k-1 |
| (xk+xk+1)/2 |
si |
n=2k |
avec k, un nombre entier. Si l'échantillon n'est pas ordonné, il suffit de l'ordonner et d'appliquer la définition précédente.
|
quartile: commande quartile
Calcule les différents quartiles d'un échantillon. Se reporter à la définition complète de la commande quartile.
|
mode: commande mode
Calcule la valeur qui apparaît le plus fréquemment dans l'échantillon. Si plusieurs valeurs apparaissent le plus grand nombre de fois, la fonction retourne le plus petit résultat possible.
|
À partir des valeurs de deux variables statistiques obtenues par collecte de données bivariables, c'est-à-dire (x1,y1),(x2,y2),...,(xn,yn) les formules des différentes fonctions sont données immédiatement. Noter que dans les exemples, même si la saisie de données peut être réalisée indépendamment pour les valeurs de l'une et l'autre variable, on doit supposer qu'il s'agit de données bivariables.
covariance: commande covariance
étant m x=moyenne(x), m y=moyenne(y). Elle peut également recevoir une liste de points et, naturellement, elle considérera que les premières coordonnées des points sont les valeurs de la première variable et que les secondes coordonnées sont les valeurs de la seconde variable observée dans les éléments de l'échantillon.
|
corrélation: commande corrélation
Calcule le coefficient de corrélation de Pearson entre un ensemble de données bivariables prises dans un échantillon. Ce paramètre indique le degré de 'relation linéaire' existant entre un échantillon et un autre. Elle peut également recevoir une liste de points et, elle considérera naturellement que les premières coordonnées des points sont les valeurs de la première variable et que les secondes coordonnées sont les valeurs de la seconde variable observée dans les éléments de l'échantillon.
|
régression linéaire: commande régression_linéaire
Étant donné un échantillon de données (x1,y1),(x2,y2),...,(xn,yn) calcule la droite de régression déduite à partir de la méthode des moindres carrés, en prenant x comme variable prédictive et y comme variable de réponse. L'application peut également recevoir une liste de points et, elle considérera naturellement que les premières coordonnées des points sont les valeurs de la première variable, et que les secondes coordonnées sont les valeurs de la seconde variable observée dans les éléments de l'échantillon.
|
|