|
La Statistica descrittiva è il ramo della statistica che raccoglie dati, li analizza e presenta i risultati con grafici o tramite il calcolo di parametri statistici, pochi numeri che tendono a descrivere l'insieme di dati. Tuttavia, in molti casi non è possibile osservare il valore della variabile per tutti gli elementi di una popolazione e in questo caso i dati vengono raccolti su un campione, ossia una parte di popolazione utilizzata per ottenere informazioni su alcune caratteristiche della popolazione totale. Questo è il tipo di situazione più rappresentativa dell'uso dei procedimenti trattati in questo capitolo.
In altre occasioni, le osservazioni della Statistica descrittiva corrispondono a valori osservati nella realizzazione di un esperimento aleatorio. In questo caso, il campione dei risultati ha lo scopo di tentare di stabilire il modello teorico che regola l'esperimento.
Nel funzionamento nell'ambito statistico, wiris opera sempre con numeri decimali, a differenza degli altri ambiti di conoscenza, conformemente alla pratica comune in questo settore.
Di seguito viene spiegato come rappresentare un campione con 3 zeri e 4 uno.
Nel primo caso è stata considerata una Lista contenente gli elementi del campione; nel secondo caso viene utilizzato un Divisore in cui si indica quante volte viene visualizzato ciascun valore. Di seguito vengono riportate alcune operazioni che è possibile realizzare con i campioni.
Occorre aggiungere, per terminare l'introduzione, che è possibile raggruppare diversi campioni di variabili aleatorie con un Divisore. Una spiegazione più dettagliata di questa funzionalità è descritta in
Multicampione; di seguito saranno forniti alcuni esempi chiarificatori.
Questo paragrafo spiega le funzioni che wiris può applicare a un insieme di dati osservati su una variabile statistica, x={x1,x2,...,xn} Con questi numeri verranno descritte le formule delle diverse funzioni applicabili a un campione.
varianza: comando varianza
Calcola la varianza in base alla definizione inferenziale. Ovvero, dove n=lunghezza(x), m x=media artimetica(x).
|
mediana: comando mediana
Se x1,x2,...,xn è ordinata, viene definita come
| xk
|
se |
n=2k-1 |
| (xk+xk+1)/2 |
se |
n=2k |
con k un numero intero. Se il campione non è ordinato è sufficiente ordinarlo e applicare la definizione riportata in precedenza.
|
moda: comando moda
Calcola il valore che compare più volte nel campione. Se viene visualizzato più di un valore, il numero massimo di volte restituisce il minor risultato possibile.
|
A partire dai valori di due variabili statistiche ottenute in una raccolta di dati bivarianti, ovvero (x1,y1),(x2,y2),...,(xn,yn) vengono indicate di seguito le formule delle diverse funzioni. Osservare negli esempi che, sebbene sia possibile inserire i dati indipendentemente per i valori dell'una o dell'altra variabile, essi dovrebbero essere dati bivarianti.
covarianza: comando covarianza
dove m x=media artimetica(x), m y=media artimetica(y). Può accettare anche una lista di punti e, naturalmente, considererà che le prime coordinate dei punti sono i valori della prima variabile e le seconde coordinate sono i valori della seconda variabile osservati negli elementi del campione.
|
correlazione: comando correlazione
Calcola il coefficiente di correlazione di Pearson tra un insieme di dati bivarianti presi da un campione. Questo parametro indica il grado di "relazione lineare" esistente tra un campione e l'altro. Può accettare anche una lista di punti e, naturalmente, considererà che le prime coordinate dei punti sono i valori della prima variabile e le seconde coordinate sono i valori della seconda variabile osservati negli elementi del campione.
|
retta regressione: comando retta_regressione
Dato un campione di dati (x1,y1),(x2,y2),...,(xn,yn) calcola la retta di regressione dedotta a partire dal metodo dei minimi quadrati, prendendo x come variabile predittiva e y come variabile di risposta. Può accettare anche una lista di punti e, naturalmente, considererà che le prime coordinate dei punti sono i valori della prima variabile e le seconde coordinate sono i valori della seconda variabile osservati negli elementi del campione.
|
|