Πρακτική εφαρμογή τυπικής απόκλισης. Υπολογισμός τυπικής απόκλισης στο Microsoft Excel

Θα πρέπει να σημειωθεί ότι αυτός ο υπολογισμός της διακύμανσης έχει ένα μειονέκτημα - αποδεικνύεται μεροληπτικός, δηλ. η μαθηματική προσδοκία του δεν είναι ίση με πραγματική αξίαδιασπορά. Περισσότερα για αυτό. Ταυτόχρονα, δεν είναι όλα τόσο άσχημα. Με αύξηση του μεγέθους του δείγματος, εξακολουθεί να προσεγγίζει το θεωρητικό του αντίστοιχο, δηλ. είναι ασυμπτωτικά αμερόληπτη. Επομένως, όταν εργάζεστε με μεγάλα μεγέθηδείγματα, μπορείτε να χρησιμοποιήσετε τον παραπάνω τύπο.

Είναι χρήσιμο να μεταφράσουμε τη γλώσσα των σημείων στη γλώσσα των λέξεων. Αποδεικνύεται ότι η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων. Δηλαδή, πρώτα υπολογίζεται η μέση τιμή, στη συνέχεια λαμβάνεται η διαφορά μεταξύ κάθε αρχικής και μέσης τιμής, τετραγωνίζεται, αθροίζεται και στη συνέχεια διαιρείται με τον αριθμό των τιμών σε αυτόν τον πληθυσμό. Η διαφορά μεταξύ της μεμονωμένης τιμής και του μέσου όρου αντανακλά το μέτρο της απόκλισης. Είναι τετράγωνο για να διασφαλιστεί ότι όλες οι αποκλίσεις γίνονται αποκλειστικά θετικοί αριθμοί και για να αποφευχθεί η αμοιβαία ακύρωση θετικών και αρνητικών αποκλίσεων όταν αθροίζονται. Στη συνέχεια, λαμβάνοντας υπόψη τις αποκλίσεις στο τετράγωνο, υπολογίζουμε απλώς τον αριθμητικό μέσο όρο. Μέσες - τετράγωνες - αποκλίσεις. Οι αποκλίσεις τετραγωνίζονται και λαμβάνεται υπόψη ο μέσος όρος. Η απάντηση βρίσκεται σε τρεις μόνο λέξεις.

Ωστόσο, στην καθαρή της μορφή, όπως, για παράδειγμα, ο αριθμητικός μέσος όρος ή ο δείκτης, η διασπορά δεν χρησιμοποιείται. Είναι μάλλον ένας βοηθητικός και ενδιάμεσος δείκτης που είναι απαραίτητος για άλλους τύπους στατιστικών αναλύσεων. Δεν έχει καν μια κανονική μονάδα μέτρησης. Κρίνοντας από τον τύπο, αυτό είναι το τετράγωνο της αρχικής μονάδας δεδομένων. Χωρίς μπουκάλι, όπως λένε, δεν θα καταλάβεις.

(ενότητα 111)

Για να επιστρέψουν τη διασπορά στην πραγματικότητα, δηλαδή να τη χρησιμοποιήσουν για πιο κοσμικούς σκοπούς, εξάγουν από αυτήν Τετραγωνική ρίζα. Αποδεικνύεται το λεγόμενο τυπική απόκλιση (RMS). Υπάρχουν ονόματα «τυπική απόκλιση» ή «σίγμα» (από το όνομα του ελληνικού γράμματος). Ο τύπος τυπικής απόκλισης είναι:

Για να λάβετε αυτόν τον δείκτη για το δείγμα, χρησιμοποιήστε τον τύπο:

Όπως και με τη διακύμανση, υπάρχει μια ελαφρώς διαφορετική επιλογή υπολογισμού. Αλλά καθώς το δείγμα μεγαλώνει, η διαφορά εξαφανίζεται.

Τυπική απόκλιση, προφανώς, χαρακτηρίζει επίσης το μέτρο της διασποράς δεδομένων, αλλά τώρα (σε αντίθεση με τη διασπορά) μπορεί να συγκριθεί με τα αρχικά δεδομένα, αφού έχουν τις ίδιες μονάδες μέτρησης (αυτό είναι σαφές από τον τύπο υπολογισμού). Αλλά αυτός ο δείκτης στην καθαρή του μορφή δεν είναι πολύ κατατοπιστικός, καθώς περιέχει πάρα πολλούς ενδιάμεσους υπολογισμούς που προκαλούν σύγχυση (απόκλιση, τετράγωνο, άθροισμα, μέσος όρος, ρίζα). Ωστόσο, είναι ήδη δυνατή η απευθείας εργασία με την τυπική απόκλιση, επειδή οι ιδιότητες αυτού του δείκτη είναι καλά μελετημένες και γνωστές. Για παράδειγμα, υπάρχει αυτό κανόνας τριών σίγμα, που δηλώνει ότι 997 σημεία δεδομένων από τα 1000 βρίσκονται εντός ±3 σίγμα από τον αριθμητικό μέσο όρο. Η τυπική απόκλιση, ως μέτρο αβεβαιότητας, εμπλέκεται επίσης σε πολλούς στατιστικούς υπολογισμούς. Με τη βοήθειά του, καθορίζεται ο βαθμός ακρίβειας διαφόρων εκτιμήσεων και προβλέψεων. Εάν η διακύμανση είναι πολύ μεγάλη, τότε η τυπική απόκλιση θα είναι επίσης μεγάλη, επομένως, η πρόβλεψη θα είναι ανακριβής, η οποία θα εκφράζεται, για παράδειγμα, σε πολύ μεγάλα διαστήματα εμπιστοσύνης.

Ο συντελεστής διακύμανσης

Μέση τιμή τυπική απόκλισηδίνει μια απόλυτη εκτίμηση του μέτρου διασποράς. Επομένως, για να κατανοήσουμε πόσο μεγάλη είναι η διαφορά σε σχέση με τις ίδιες τις τιμές (δηλαδή, ανεξάρτητα από την κλίμακα τους), απαιτείται ένας σχετικός δείκτης. Αυτός ο δείκτης ονομάζεται συντελεστής διακύμανσηςκαι υπολογίζεται με τον ακόλουθο τύπο:

Ο συντελεστής διακύμανσης μετράται ως ποσοστό (εάν πολλαπλασιαστεί επί 100%). Με αυτόν τον δείκτη, μπορείτε να συγκρίνετε μια ποικιλία φαινομένων, ανεξάρτητα από την κλίμακα και τις μονάδες μέτρησής τους. Αυτό το γεγονόςκαι κάνει τον συντελεστή διακύμανσης τόσο δημοφιλή.

Στα στατιστικά, γίνεται αποδεκτό ότι εάν η τιμή του συντελεστή διακύμανσης είναι μικρότερη από 33%, τότε ο πληθυσμός θεωρείται ομοιογενής, εάν είναι μεγαλύτερος από 33%, τότε είναι ετερογενής. Μου είναι δύσκολο να σχολιάσω εδώ. Δεν ξέρω ποιος και γιατί το όρισε έτσι, αλλά θεωρείται αξίωμα.

Νιώθω ότι παρασύρθηκα από μια ξερή θεωρία και πρέπει να φέρω κάτι οπτικό και μεταφορικό. Από την άλλη πλευρά, όλοι οι δείκτες διακύμανσης περιγράφουν περίπου το ίδιο πράγμα, μόνο που υπολογίζονται διαφορετικά. Ως εκ τούτου, είναι δύσκολο να λάμψετε με μια ποικιλία παραδειγμάτων. Μόνο οι τιμές των δεικτών μπορούν να διαφέρουν, αλλά όχι η ουσία τους. Ας συγκρίνουμε λοιπόν πώς διαφέρουν οι τιμές διαφορετικών δεικτών διακύμανσης για το ίδιο σύνολο δεδομένων. Ας πάρουμε ένα παράδειγμα με τον υπολογισμό της μέσης γραμμικής απόκλισης (του ). Εδώ είναι τα αρχικά δεδομένα:

Και ένα διάγραμμα υπενθύμισης.

Με βάση αυτά τα δεδομένα, υπολογίζουμε διάφορους δείκτες διακύμανσης.

Ο μέσος όρος είναι ο συνηθισμένος αριθμητικός μέσος όρος.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ του μέγιστου και του ελάχιστου:

Μέση τιμή γραμμική απόκλισηυπολογίζεται σύμφωνα με τον τύπο:

Τυπική απόκλιση:

Συνοψίζουμε τον υπολογισμό σε έναν πίνακα.

Όπως μπορείτε να δείτε, ο γραμμικός μέσος όρος και η τυπική απόκλιση δίνουν παρόμοιες τιμές για το βαθμό διακύμανσης των δεδομένων. Η διακύμανση είναι σίγμα στο τετράγωνο, επομένως θα είναι πάντα σχετική. ένας μεγάλος αριθμόςπου στην πραγματικότητα δεν λέει τίποτα. Το εύρος διακύμανσης είναι η διαφορά μεταξύ των άκρων και μπορεί να πει πολλά.

Ας συνοψίσουμε μερικά αποτελέσματα.

Η παραλλαγή ενός δείκτη αντανακλά τη μεταβλητότητα μιας διαδικασίας ή ενός φαινομένου. Ο βαθμός του μπορεί να μετρηθεί χρησιμοποιώντας διάφορους δείκτες.

1. Το εύρος διακύμανσης είναι η διαφορά μεταξύ του μέγιστου και του ελάχιστου. αντανακλούν το εύρος πιθανές τιμές.
2. Μέση γραμμική απόκλιση - αντικατοπτρίζει τον μέσο όρο των απόλυτων (modulo) αποκλίσεων όλων των τιμών του αναλυόμενου πληθυσμού από τη μέση τιμή τους.
3. Διασπορά - το μέσο τετράγωνο των αποκλίσεων.
4. Τυπική απόκλιση - η ρίζα της διακύμανσης (μέσες τετραγωνικές αποκλίσεις).
5. Ο συντελεστής διακύμανσης είναι ο πιο καθολικός δείκτης που αντανακλά τον βαθμό διασποράς των τιμών, ανεξάρτητα από την κλίμακα και τις μονάδες μέτρησής τους. Ο συντελεστής διακύμανσης μετράται ως ποσοστό και μπορεί να χρησιμοποιηθεί για τη σύγκριση της διακύμανσης διαφόρων διεργασιών και φαινομένων.

Έτσι, στη στατιστική ανάλυση υπάρχει ένα σύστημα δεικτών που αντικατοπτρίζουν την ομοιογένεια των φαινομένων και τη σταθερότητα των διαδικασιών. Συχνά, οι δείκτες διακύμανσης δεν έχουν ανεξάρτητο νόημα και χρησιμοποιούνται για περαιτέρω ανάλυση δεδομένων (υπολογισμός διαστημάτων εμπιστοσύνης

Σοφοί μαθηματικοί και στατιστικολόγοι κατέληξαν σε έναν πιο αξιόπιστο δείκτη, αν και για έναν ελαφρώς διαφορετικό σκοπό - μέση γραμμική απόκλιση. Αυτός ο δείκτης χαρακτηρίζει το μέτρο της εξάπλωσης των τιμών του συνόλου δεδομένων γύρω από τη μέση τιμή τους.

Για να δείξετε το μέτρο της εξάπλωσης των δεδομένων, πρέπει πρώτα να προσδιορίσετε σε τι σχέση θα θεωρείται αυτό το spread - συνήθως αυτή είναι η μέση τιμή. Στη συνέχεια, πρέπει να υπολογίσετε πόσο μακριά απέχουν οι τιμές του αναλυόμενου συνόλου δεδομένων από τον μέσο όρο. Είναι σαφές ότι κάθε τιμή αντιστοιχεί σε ένα ορισμένο ποσό απόκλισης, αλλά μας ενδιαφέρει επίσης μια γενική εκτίμηση που καλύπτει ολόκληρο τον πληθυσμό. Επομένως, η μέση απόκλιση υπολογίζεται χρησιμοποιώντας τον τύπο του συνηθισμένου αριθμητικού μέσου όρου. Αλλά! Αλλά για να υπολογιστεί ο μέσος όρος των αποκλίσεων, πρέπει πρώτα να προστεθούν. Και αν προσθέσουμε θετικούς και αρνητικούς αριθμούς, θα ακυρωθούν μεταξύ τους και το άθροισμά τους θα τείνει στο μηδέν. Για να αποφευχθεί αυτό, όλες οι αποκλίσεις λαμβάνονται modulo, δηλαδή όλοι οι αρνητικοί αριθμοί γίνονται θετικοί. Τώρα η μέση απόκλιση θα δείχνει ένα γενικευμένο μέτρο της εξάπλωσης των τιμών. Ως αποτέλεσμα, η μέση γραμμική απόκλιση θα υπολογιστεί από τον τύπο:

έναείναι η μέση γραμμική απόκλιση,

Χ- ο αναλυόμενος δείκτης, με μια παύλα στην κορυφή - η μέση τιμή του δείκτη,

nείναι ο αριθμός των τιμών στο σύνολο δεδομένων που αναλύθηκε,

ο τελεστής άθροισης, ελπίζω, να μην τρομάζει κανέναν.

Η μέση γραμμική απόκλιση που υπολογίζεται χρησιμοποιώντας τον καθορισμένο τύπο αντικατοπτρίζει τη μέση απόλυτη απόκλιση από τη μέση τιμή για αυτόν τον πληθυσμό.

Η κόκκινη γραμμή στην εικόνα είναι η μέση τιμή. Οι αποκλίσεις κάθε παρατήρησης από το μέσο όρο υποδεικνύονται με μικρά βέλη. Λαμβάνονται modulo και συνοψίζονται. Τότε όλα διαιρούνται με τον αριθμό των τιμών.

Για να ολοκληρωθεί η εικόνα, πρέπει να δοθεί ένα ακόμη παράδειγμα. Ας πούμε ότι υπάρχει μια εταιρεία που κατασκευάζει μοσχεύματα για φτυάρια. Κάθε κόψιμο πρέπει να έχει μήκος 1,5 μέτρο, αλλά, το πιο σημαντικό, πρέπει να είναι όλα ίδια ή τουλάχιστον συν ή πλην 5 εκ. Ωστόσο, οι αμελείς εργάτες θα κόψουν 1,2 μ. και μετά 1,8 μ. . Ο διευθυντής της εταιρείας αποφάσισε να πραγματοποιήσει μια στατιστική ανάλυση του μήκους των μοσχευμάτων. Διάλεξα 10 κομμάτια και μέτρησα το μήκος τους, βρήκα τον μέσο όρο και υπολόγισα τη μέση γραμμική απόκλιση. Ο μέσος όρος αποδείχθηκε ότι ήταν ακριβώς σωστός - 1,5 μ. Αλλά η μέση γραμμική απόκλιση αποδείχθηκε 0,16 μ. Έτσι αποδεικνύεται ότι κάθε κοπή είναι μακρύτερο ή μικρότερο από ό,τι χρειάζεται κατά μέσο όρο κατά 16 εκατοστά. Υπάρχει κάτι για να μιλήσουμε με εργάτες. Στην πραγματικότητα, δεν έχω δει την πραγματική χρήση αυτού του δείκτη, οπότε βρήκα ένα παράδειγμα μόνος μου. Ωστόσο, υπάρχει ένας τέτοιος δείκτης στα στατιστικά στοιχεία.

Διασπορά

Όπως η μέση γραμμική απόκλιση, η διακύμανση αντικατοπτρίζει επίσης τον βαθμό στον οποίο τα δεδομένα εξαπλώνονται γύρω από τον μέσο όρο.

Ο τύπος για τον υπολογισμό της διακύμανσης μοιάζει με αυτό:

(για σειρές παραλλαγών (σταθμισμένη διακύμανση))

(για μη ομαδοποιημένα δεδομένα (απλή διακύμανση))

Όπου: σ 2 - διασπορά, Xi– αναλύουμε τον δείκτη sq (τιμή χαρακτηριστικών), – τη μέση τιμή του δείκτη, f i – τον ​​αριθμό των τιμών στο αναλυόμενο σύνολο δεδομένων.

Η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων.

Αρχικά, υπολογίζεται ο μέσος όρος, στη συνέχεια λαμβάνεται η διαφορά μεταξύ κάθε γραμμής βάσης και μέσου όρου, τετραγωνίζεται, πολλαπλασιάζεται με τη συχνότητα της αντίστοιχης τιμής χαρακτηριστικού, προστίθεται και στη συνέχεια διαιρείται με τον αριθμό των τιμών στον πληθυσμό.

Ωστόσο, στην καθαρή της μορφή, όπως, για παράδειγμα, ο αριθμητικός μέσος όρος ή ο δείκτης, η διασπορά δεν χρησιμοποιείται. Είναι μάλλον ένας βοηθητικός και ενδιάμεσος δείκτης που χρησιμοποιείται για άλλους τύπους στατιστικών αναλύσεων.

Απλοποιημένος τρόπος υπολογισμού της διακύμανσης

τυπική απόκλιση

Για να χρησιμοποιηθεί η διακύμανση για την ανάλυση δεδομένων, λαμβάνεται μια τετραγωνική ρίζα από αυτήν. Αποδεικνύεται το λεγόμενο τυπική απόκλιση.

Παρεμπιπτόντως, η τυπική απόκλιση ονομάζεται επίσης σίγμα - από το ελληνικό γράμμα που τη δηλώνει.

Η τυπική απόκλιση προφανώς χαρακτηρίζει και το μέτρο της διασποράς δεδομένων, αλλά τώρα (σε αντίθεση με τη διασπορά) μπορεί να συγκριθεί με τα αρχικά δεδομένα. Κατά κανόνα, οι δείκτες μέσου τετραγώνου στα στατιστικά δίνουν πιο ακριβή αποτελέσματα από τους γραμμικούς. Επομένως, η τυπική απόκλιση είναι ένα πιο ακριβές μέτρο της διασποράς δεδομένων από τη μέση γραμμική απόκλιση.

Μια κατά προσέγγιση μέθοδος για την εκτίμηση της διακύμανσης μιας μεταβλητής σειράς είναι ο προσδιορισμός του ορίου και του πλάτους, ωστόσο, οι τιμές της παραλλαγής εντός της σειράς δεν λαμβάνονται υπόψη. Το κύριο γενικά αποδεκτό μέτρο της διακύμανσης ενός ποσοτικού χαρακτηριστικού εντός του εύρους των διακυμάνσεων είναι τυπική απόκλιση (σ - σίγμα). Όσο μεγαλύτερη είναι η τυπική απόκλιση, τόσο μεγαλύτερος είναι ο βαθμός διακύμανσης αυτής της σειράς.

Η μέθοδος για τον υπολογισμό της τυπικής απόκλισης περιλαμβάνει τα ακόλουθα βήματα:

1. Να βρείτε τον αριθμητικό μέσο όρο (Μ).

2. Προσδιορίστε τις αποκλίσεις των επιμέρους επιλογών από τον αριθμητικό μέσο όρο (d=V-M). Στις ιατρικές στατιστικές, οι αποκλίσεις από τον μέσο όρο συμβολίζονται ως d (απόκλιση). Το άθροισμα όλων των αποκλίσεων είναι ίσο με μηδέν.

3. Τετράγωνο κάθε απόκλισης d 2 .

4. Πολλαπλασιάστε τις τετράγωνες αποκλίσεις με τις αντίστοιχες συχνότητες d 2 *p.

5. Βρείτε το άθροισμα των γινομένων å(d 2 *p)

6. Υπολογίστε την τυπική απόκλιση με τον τύπο:

Όταν το n είναι μεγαλύτερο από 30 ή όταν το n είναι μικρότερο ή ίσο με 30, όπου n είναι ο αριθμός όλων των επιλογών.

Μέση τιμή τυπική απόκλιση:

1. Η τυπική απόκλιση χαρακτηρίζει την εξάπλωση της παραλλαγής σε σχέση με τη μέση τιμή (δηλαδή, τη διακύμανση της σειράς διακύμανσης). Όσο μεγαλύτερο είναι το σίγμα, τόσο μεγαλύτερος είναι ο βαθμός ποικιλομορφίας αυτής της σειράς.

2. Η τυπική απόκλιση χρησιμοποιείται για μια συγκριτική αξιολόγηση του βαθμού συμμόρφωσης του αριθμητικού μέσου όρου με τη σειρά διακύμανσης για την οποία υπολογίστηκε.

Οι παραλλαγές των φαινομένων μάζας υπακούουν στο νόμο της κανονικής κατανομής. Η καμπύλη που αντιπροσωπεύει αυτή την κατανομή έχει τη μορφή μιας ομαλής συμμετρικής καμπύλης σε σχήμα καμπάνας (καμπύλη Gauss). Σύμφωνα με τη θεωρία των πιθανοτήτων σε φαινόμενα που υπακούουν στον νόμο της κανονικής κατανομής, υπάρχει μια αυστηρή μαθηματική σχέση μεταξύ των τιμών του αριθμητικού μέσου όρου και της τυπικής απόκλισης. Η θεωρητική κατανομή μιας παραλλαγής σε μια ομοιογενή σειρά παραλλαγής υπακούει στον κανόνα των τριών σίγμα.

Αν στο σύστημα ορθογώνιες συντεταγμένεςσχεδιάστε τις τιμές του ποσοτικού χαρακτηριστικού (επιλογές) στον άξονα της τετμημένης και τη συχνότητα εμφάνισης της παραλλαγής στη σειρά παραλλαγής στον άξονα τεταγμένων, και στη συνέχεια οι παραλλαγές με μεγαλύτερες και μικρότερες τιμές βρίσκονται ομοιόμορφα στις πλευρές του ο αριθμητικός μέσος όρος.



Έχει διαπιστωθεί ότι με κανονική κατανομή του χαρακτηριστικού:

Το 68,3% των τιμών της παραλλαγής είναι εντός Μ±1s

Το 95,5% των τιμών της παραλλαγής είναι εντός M±2s

Το 99,7% των τιμών της παραλλαγής είναι εντός M±3s

3. Η τυπική απόκλιση σάς επιτρέπει να ορίσετε τις κανονικές τιμές για κλινικές και βιολογικές παραμέτρους. Στην ιατρική, το διάστημα M ± 1 s συνήθως λαμβάνεται εκτός του φυσιολογικού εύρους για το υπό μελέτη φαινόμενο. Η απόκλιση της εκτιμώμενης τιμής από τον αριθμητικό μέσο όρο κατά περισσότερο από 1 s υποδεικνύει την απόκλιση της μελετημένης παραμέτρου από τον κανόνα.

4. Στην ιατρική, ο κανόνας των τριών σίγμα χρησιμοποιείται στην παιδιατρική για την ατομική αξιολόγηση του επιπέδου φυσική ανάπτυξηπαιδιά (μέθοδος αποκλίσεων σίγμα), για την ανάπτυξη προτύπων για την παιδική ένδυση

5. Η τυπική απόκλιση είναι απαραίτητη για τον χαρακτηρισμό του βαθμού ποικιλομορφίας του υπό μελέτη χαρακτηριστικού και τον υπολογισμό του σφάλματος του αριθμητικού μέσου όρου.

Η τιμή της τυπικής απόκλισης χρησιμοποιείται συνήθως για τη σύγκριση των διακυμάνσεων του ίδιου τύπου σειράς. Εάν συγκριθούν δύο σειρές με διαφορετικά χαρακτηριστικά (ύψος και βάρος, μέση διάρκεια νοσηλείας και νοσοκομειακή θνησιμότητα κ.λπ.), τότε είναι αδύνατη η άμεση σύγκριση μεγεθών σίγμα. , επειδή τυπική απόκλιση - μια ονομαστική τιμή, εκφρασμένη σε απόλυτους αριθμούς. Σε αυτές τις περιπτώσεις, εφαρμόστε συντελεστής διακύμανσης (Cv), που είναι μια σχετική τιμή: το ποσοστό της τυπικής απόκλισης στον αριθμητικό μέσο όρο.

Ο συντελεστής διακύμανσης υπολογίζεται από τον τύπο:

Όσο μεγαλύτερος είναι ο συντελεστής διακύμανσης , τόσο μεγαλύτερη είναι η μεταβλητότητα αυτής της σειράς. Πιστεύεται ότι ο συντελεστής διακύμανσης άνω του 30% υποδηλώνει την ποιοτική ετερογένεια του πληθυσμού.

Κατά τον στατιστικό έλεγχο υποθέσεων, κατά τη μέτρηση μιας γραμμικής σχέσης μεταξύ τυχαίων μεταβλητών.

Τυπική απόκλιση:

Τυπική απόκλιση(εκτίμηση τυπικής απόκλισης τυχαία μεταβλητήΤο πάτωμα, οι τοίχοι γύρω μας και το ταβάνι Χσε σχέση με τη μαθηματική του προσδοκία που βασίζεται σε μια αμερόληπτη εκτίμηση της διακύμανσής του):

όπου - διακύμανση; - Το πάτωμα, οι τοίχοι γύρω μας και η οροφή, Εγώ-ο δείγμα στοιχείου? - το μέγεθος του δείγματος; - αριθμητικός μέσος όρος του δείγματος:

Πρέπει να σημειωθεί ότι και οι δύο εκτιμήσεις είναι μεροληπτικές. Στη γενική περίπτωση, είναι αδύνατο να κατασκευαστεί μια αμερόληπτη εκτίμηση. Ωστόσο, μια εκτίμηση που βασίζεται σε μια αμερόληπτη εκτίμηση διακύμανσης είναι συνεπής.

κανόνας τριών σίγμα

κανόνας τριών σίγμα() - σχεδόν όλες οι τιμές μιας κανονικά κατανεμημένης τυχαίας μεταβλητής βρίσκονται στο διάστημα . Πιο αυστηρά - με βεβαιότητα τουλάχιστον 99,7%, η τιμή μιας κανονικά κατανεμημένης τυχαίας μεταβλητής βρίσκεται στο καθορισμένο διάστημα (με την προϋπόθεση ότι η τιμή είναι αληθής και δεν λαμβάνεται ως αποτέλεσμα της επεξεργασίας του δείγματος).

Εάν η πραγματική τιμή είναι άγνωστη, τότε δεν πρέπει να χρησιμοποιήσετε, αλλά το πάτωμα, τους τοίχους γύρω μας και την οροφή, μικρό. Έτσι, ο κανόνας των τριών σίγμα μεταφράζεται στον κανόνα των τριών ορόφων, των τοίχων γύρω μας και της οροφής, μικρό .

Ερμηνεία της τιμής της τυπικής απόκλισης

Μια μεγάλη τιμή της τυπικής απόκλισης δείχνει μια μεγάλη διασπορά τιμών στο παρουσιαζόμενο σύνολο συν μέση τιμήσκηνικά; μια μικρή τιμή, αντίστοιχα, δείχνει ότι οι τιμές στο σύνολο ομαδοποιούνται γύρω από τη μέση τιμή.

Για παράδειγμα, έχουμε τρία σύνολα αριθμών: (0, 0, 14, 14), (0, 6, 8, 14) και (6, 6, 8, 8). Και τα τρία σύνολα έχουν μέσες τιμές 7 και τυπικές αποκλίσεις 7, 5 και 1, αντίστοιχα. Το τελευταίο σύνολο έχει μια μικρή τυπική απόκλιση επειδή οι τιμές στο σύνολο συγκεντρώνονται γύρω από το μέσο όρο. το πρώτο σετ έχει τα περισσότερα μεγάλης σημασίαςτυπική απόκλιση - οι τιμές εντός του συνόλου αποκλίνουν έντονα από τη μέση τιμή.

Σε γενικές γραμμές, η τυπική απόκλιση μπορεί να θεωρηθεί ως μέτρο αβεβαιότητας. Για παράδειγμα, στη φυσική, η τυπική απόκλιση χρησιμοποιείται για τον προσδιορισμό του σφάλματος μιας σειράς διαδοχικών μετρήσεων κάποιας ποσότητας. Αυτή η τιμή είναι πολύ σημαντική για τον προσδιορισμό της αληθοφάνειας του υπό μελέτη φαινομένου σε σύγκριση με την τιμή που προβλέπεται από τη θεωρία: εάν η μέση τιμή των μετρήσεων είναι πολύ διαφορετική από τις τιμές που προβλέπονται από τη θεωρία (μεγάλη τυπική απόκλιση), τότε οι λαμβανόμενες τιμές ή η μέθοδος απόκτησής τους θα πρέπει να επανελεγχθούν.

Πρακτική χρήση

Στην πράξη, η τυπική απόκλιση σάς επιτρέπει να προσδιορίσετε πόσο οι τιμές στο σετ μπορούν να διαφέρουν από τη μέση τιμή.

Κλίμα

Ας υποθέσουμε ότι υπάρχουν δύο πόλεις με την ίδια μέση ημερήσια μέγιστη θερμοκρασία, αλλά η μία βρίσκεται στην ακτή και η άλλη στην ενδοχώρα. Οι παράκτιες πόλεις είναι γνωστό ότι έχουν πολλές διαφορετικές ημερήσιες μέγιστες θερμοκρασίες χαμηλότερες από τις πόλεις της ενδοχώρας. Επομένως, η τυπική απόκλιση των μέγιστων ημερήσιων θερμοκρασιών για την παράκτια πόλη θα είναι μικρότερη από τη δεύτερη πόλη, παρά το γεγονός ότι έχουν την ίδια μέση τιμή αυτής της τιμής, πράγμα που στην πράξη σημαίνει ότι η πιθανότητα Μέγιστη θερμοκρασίαΟ αέρας κάθε συγκεκριμένης ημέρας του έτους θα διαφέρει περισσότερο από τη μέση τιμή, υψηλότερη για μια πόλη που βρίσκεται εντός της ηπείρου.

Αθλημα

Ας υποθέσουμε ότι υπάρχουν πολλά ποδοσφαιρικές ομάδες, οι οποίες αξιολογούνται από ορισμένες παραμέτρους, για παράδειγμα, τον αριθμό των γκολ που σημειώθηκαν και δέχθηκαν, τις ευκαιρίες για γκολ κ.λπ. Το πιο πιθανό είναι ότι η καλύτερη ομάδα αυτού του ομίλου θα έχει καλύτερες αξίεςεπί περισσότεροΠαράμετροι. Όσο μικρότερη είναι η τυπική απόκλιση της ομάδας για κάθε μία από τις παραμέτρους που παρουσιάζονται, τόσο πιο προβλέψιμο είναι το αποτέλεσμα της ομάδας, τέτοιες ομάδες είναι ισορροπημένες. Από την άλλη, η ομάδα με μεγάλη αξίαΗ τυπική απόκλιση είναι δύσκολο να προβλεφθεί το αποτέλεσμα, το οποίο με τη σειρά του εξηγείται από την ανισορροπία, για παράδειγμα, ισχυρή άμυνα, αλλά αδύναμη επίθεση.

Η χρήση της τυπικής απόκλισης των παραμέτρων της ομάδας επιτρέπει σε κάποιον να προβλέψει το αποτέλεσμα του αγώνα μεταξύ δύο ομάδων σε κάποιο βαθμό, αξιολογώντας τα δυνατά σημεία και αδύναμες πλευρέςεντολές, και ως εκ τούτου οι επιλεγμένες μέθοδοι αγώνα.

Τεχνική ανάλυση

δείτε επίσης

Βιβλιογραφία

* Borovikov, V.ΣΤΑΤΙΣΤΙΚΗ. Η τέχνη της ανάλυσης δεδομένων υπολογιστή: Για επαγγελματίες / V. Borovikov. - Αγία Πετρούπολη. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Εντολή

Ας υπάρχουν αρκετοί αριθμοί που χαρακτηρίζουν - ή ομοιογενείς ποσότητες. Για παράδειγμα, τα αποτελέσματα των μετρήσεων, των ζυγίσεων, των στατιστικών παρατηρήσεων κ.λπ. Όλες οι ποσότητες που παρουσιάζονται πρέπει να μετρώνται με την ίδια μέτρηση. Για να βρείτε την τυπική απόκλιση, κάντε τα εξής.

Προσδιορίστε τον αριθμητικό μέσο όρο όλων των αριθμών: προσθέστε όλους τους αριθμούς και διαιρέστε το άθροισμα με τον συνολικό αριθμό των αριθμών.

Προσδιορίστε τη διασπορά (σκέδαση) των αριθμών: αθροίστε τα τετράγωνα των αποκλίσεων που βρέθηκαν νωρίτερα και διαιρέστε το άθροισμα που προκύπτει με τον αριθμό των αριθμών.

Στο θάλαμο βρίσκονται επτά ασθενείς με θερμοκρασία 34, 35, 36, 37, 38, 39 και 40 βαθμούς Κελσίου.

Απαιτείται ο προσδιορισμός της μέσης απόκλισης από τον μέσο όρο.
Λύση:
"στον θάλαμο": (34+35+36+37+38+39+40)/7=37 ºС;

Αποκλίσεις θερμοκρασίας από τον μέσο όρο (σε αυτή την περίπτωση, η κανονική τιμή): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, αποδεικνύεται: -3, -2, -1 , 0, 1, 2, 3 (ºС);

Διαιρέστε το άθροισμα των αριθμών που λήφθηκαν νωρίτερα με τον αριθμό τους. Για την ακρίβεια του υπολογισμού, είναι καλύτερο να χρησιμοποιήσετε μια αριθμομηχανή. Το αποτέλεσμα της διαίρεσης είναι ο αριθμητικός μέσος όρος των αθροισμάτων.

Δώστε ιδιαίτερη προσοχή σε όλα τα στάδια του υπολογισμού, καθώς ένα σφάλμα σε τουλάχιστον έναν από τους υπολογισμούς θα οδηγήσει σε λανθασμένο τελικό δείκτη. Ελέγξτε τους ληφθέντες υπολογισμούς σε κάθε στάδιο. Ο αριθμητικός μέσος όρος έχει τον ίδιο μετρητή με τις αθροίσεις των αριθμών, δηλαδή, εάν προσδιορίσετε τη μέση συμμετοχή, τότε όλοι οι δείκτες θα είναι "άτομο".

Αυτή η μέθοδοςο υπολογισμός χρησιμοποιείται μόνο σε μαθηματικούς και στατιστικούς υπολογισμούς. Έτσι, για παράδειγμα, ο μέσος όρος αριθμητική τιμήστην επιστήμη των υπολογιστών έχει διαφορετικό αλγόριθμο υπολογισμού. Ο αριθμητικός μέσος όρος είναι ένας πολύ υπό όρους δείκτης. Δείχνει την πιθανότητα ενός γεγονότος, με την προϋπόθεση ότι έχει μόνο έναν παράγοντα ή δείκτη. Για την πιο εις βάθος ανάλυση, πρέπει να ληφθούν υπόψη πολλοί παράγοντες. Για αυτό, χρησιμοποιείται ο υπολογισμός γενικότερων ποσοτήτων.

Ο αριθμητικός μέσος όρος είναι ένα από τα μέτρα της κεντρικής τάσης, που χρησιμοποιείται ευρέως στα μαθηματικά και τους στατιστικούς υπολογισμούς. Η εύρεση του αριθμητικού μέσου όρου πολλών τιμών​​είναι πολύ απλή, αλλά κάθε εργασία έχει τις δικές της αποχρώσεις, τις οποίες είναι απλώς απαραίτητο να γνωρίζουμε για να εκτελέσουμε σωστούς υπολογισμούς.

Ποσοτικά αποτελέσματα τέτοιων πειραμάτων.

Πώς να βρείτε τον αριθμητικό μέσο όρο

Εύρεση μέσου όρου αριθμητικός αριθμόςγια έναν πίνακα αριθμών, θα πρέπει να ξεκινήσετε προσδιορίζοντας το αλγεβρικό άθροισμα αυτών των τιμών. Για παράδειγμα, εάν ο πίνακας περιέχει τους αριθμούς 23, 43, 10, 74 και 34, τότε το αλγεβρικό άθροισμά τους θα είναι 184. Κατά τη γραφή, ο αριθμητικός μέσος όρος συμβολίζεται με το γράμμα μ (mu) ή x (x με ράβδο) . Στη συνέχεια, το αλγεβρικό άθροισμα πρέπει να διαιρεθεί με τον αριθμό των αριθμών του πίνακα. Σε αυτό το παράδειγμα, υπήρχαν πέντε αριθμοί, οπότε ο αριθμητικός μέσος όρος θα είναι 184/5 και θα είναι 36,8.

Χαρακτηριστικά της εργασίας με αρνητικούς αριθμούς

Αν ο πίνακας περιέχει αρνητικούς αριθμούς, τότε η εύρεση του αριθμητικού μέσου όρου γίνεται σύμφωνα με έναν παρόμοιο αλγόριθμο. Υπάρχει διαφορά μόνο κατά τον υπολογισμό στο περιβάλλον προγραμματισμού ή εάν η εργασία έχει πρόσθετους όρους. Σε αυτές τις περιπτώσεις, η εύρεση του αριθμητικού μέσου όρου των αριθμών με διαφορετικά σημάδιακαταλήγει σε τρία βήματα:

1. Εύρεση του κοινού αριθμητικού μέσου όρου με την τυπική μέθοδο.
2. Εύρεση του αριθμητικού μέσου όρου των αρνητικών αριθμών.
3. Υπολογισμός του αριθμητικού μέσου όρου των θετικών αριθμών.

Οι απαντήσεις καθεμιάς από τις ενέργειες γράφονται χωρισμένες με κόμμα.

Φυσικά και δεκαδικά κλάσματα

Αν παρουσιαστεί ένας πίνακας αριθμών δεκαδικά, η λύση εμφανίζεται σύμφωνα με τη μέθοδο υπολογισμού του αριθμητικού μέσου όρου των ακεραίων, αλλά το αποτέλεσμα μειώνεται σύμφωνα με τις απαιτήσεις του προβλήματος για την ακρίβεια της απάντησης.

Όταν εργάζεστε με φυσικά κλάσματα, θα πρέπει να μειωθούν σε έναν κοινό παρονομαστή, ο οποίος πολλαπλασιάζεται με τον αριθμό των αριθμών του πίνακα. Ο αριθμητής της απάντησης θα είναι το άθροισμα των δεδομένων αριθμητών των αρχικών κλασματικών στοιχείων.