Ο αριθμητικός μέσος όρος δείχνει. Προσδιορισμός του μέσου όρου, διακύμανσης και σχήματος κατανομής

Κατά τη διαδικασία των διαφόρων υπολογισμών και της εργασίας με δεδομένα, είναι συχνά απαραίτητο να υπολογιστεί η μέση τιμή τους. Υπολογίζεται προσθέτοντας τους αριθμούς και διαιρώντας το σύνολο με τον αριθμό τους. Ας μάθουμε πώς να υπολογίσουμε τη μέση τιμή ενός συνόλου αριθμών χρησιμοποιώντας το πρόγραμμα Microsoft Excelδιαφορετικοί τρόποι.

Ο ευκολότερος και πιο γνωστός τρόπος για να βρείτε τον αριθμητικό μέσο όρο ενός συνόλου αριθμών είναι να χρησιμοποιήσετε το ειδικό κουμπί στην κορδέλα του Microsoft Excel. Επιλέγουμε μια σειρά αριθμών που βρίσκονται σε μια στήλη ή μια γραμμή ενός εγγράφου. Όντας στην καρτέλα "Αρχική σελίδα", κάντε κλικ στο κουμπί "Αυτόματη χρήση", το οποίο βρίσκεται στην κορδέλα στο μπλοκ εργαλείων "Επεξεργασία". Επιλέξτε "Μέσος όρος" από την αναπτυσσόμενη λίστα.

Μετά από αυτό, χρησιμοποιώντας τη συνάρτηση «ΜΕΣΟΣ», γίνεται ο υπολογισμός. Στο κελί κάτω από την επιλεγμένη στήλη ή στα δεξιά της επιλεγμένης σειράς, εμφανίζεται ο αριθμητικός μέσος όρος του δεδομένου συνόλου αριθμών.

Αυτή η μέθοδος είναι καλή για απλότητα και ευκολία. Ωστόσο, έχει επίσης σημαντικά μειονεκτήματα. Χρησιμοποιώντας αυτήν τη μέθοδο, μπορείτε να υπολογίσετε τη μέση τιμή μόνο εκείνων των αριθμών που είναι διατεταγμένοι σε μια σειρά σε μία στήλη ή σε μία σειρά. Αλλά, με μια σειρά κελιών ή με διάσπαρτα κελιά σε ένα φύλλο, δεν μπορείτε να εργαστείτε χρησιμοποιώντας αυτήν τη μέθοδο.

Για παράδειγμα, εάν επιλέξετε δύο στήλες και υπολογίσετε τον αριθμητικό μέσο όρο χρησιμοποιώντας την παραπάνω μέθοδο, τότε η απάντηση θα δοθεί για κάθε στήλη ξεχωριστά και όχι για ολόκληρη τη σειρά κελιών.

Υπολογισμός με το Function Wizard

Για περιπτώσεις όπου χρειάζεται να υπολογίσετε τον αριθμητικό μέσο όρο μιας σειράς κελιών ή διάσπαρτων κελιών, μπορείτε να χρησιμοποιήσετε τον Οδηγό συνάρτησης. Εξακολουθεί να χρησιμοποιεί την ίδια συνάρτηση AVERAGE που γνωρίζουμε από την πρώτη μέθοδο υπολογισμού, αλλά το κάνει με λίγο διαφορετικό τρόπο.

Κάνουμε κλικ στο κελί όπου θέλουμε να εμφανίζεται το αποτέλεσμα του υπολογισμού της μέσης τιμής. Κάντε κλικ στο κουμπί "Εισαγωγή συνάρτησης", το οποίο βρίσκεται στα αριστερά της γραμμής τύπων. Ή, πληκτρολογούμε τον συνδυασμό Shift + F3 στο πληκτρολόγιο.

Ξεκινά ο Οδηγός λειτουργιών. Στη λίστα των λειτουργιών που παρουσιάζονται, αναζητούμε "ΜΕΣΟΣ". Επιλέξτε το και κάντε κλικ στο κουμπί "OK".

Ανοίγει το παράθυρο ορισμάτων για αυτήν τη συνάρτηση. Τα ορίσματα συνάρτησης εισάγονται στα πεδία "Αριθμός". Θα μπορούσε να είναι σαν κανονικούς αριθμούς, και τις διευθύνσεις των κελιών όπου βρίσκονται αυτοί οι αριθμοί. Εάν δεν σας βολεύει να εισάγετε διευθύνσεις κελιών με μη αυτόματο τρόπο, τότε θα πρέπει να κάνετε κλικ στο κουμπί που βρίσκεται στα δεξιά του πεδίου εισαγωγής δεδομένων.

Μετά από αυτό, το παράθυρο ορισμάτων συνάρτησης θα συμπτύξει και μπορείτε να επιλέξετε την ομάδα κελιών στο φύλλο που παίρνετε για υπολογισμό. Στη συνέχεια, κάντε ξανά κλικ στο κουμπί στα αριστερά του πεδίου εισαγωγής δεδομένων για να επιστρέψετε στο παράθυρο ορισμάτων συνάρτησης.

Εάν θέλετε να υπολογίσετε τον αριθμητικό μέσο όρο μεταξύ των αριθμών σε διαφορετικές ομάδες κελιών, κάντε τα ίδια βήματα που αναφέρθηκαν παραπάνω στο πεδίο "Αριθμός 2". Και ούτω καθεξής μέχρι όλα επιθυμητές ομάδεςτα κελιά δεν θα επιλεγούν.

Μετά από αυτό, κάντε κλικ στο κουμπί "OK".

Το αποτέλεσμα του υπολογισμού του αριθμητικού μέσου όρου θα επισημανθεί στο κελί που επιλέξατε πριν ξεκινήσετε τον Οδηγό συναρτήσεων.

Μπάρα φόρμουλας

Υπάρχει ένας τρίτος τρόπος εκτέλεσης της συνάρτησης "ΜΕΣΟΣ". Για να το κάνετε αυτό, μεταβείτε στην καρτέλα Τύποι. Επιλέξτε το κελί στο οποίο θα εμφανίζεται το αποτέλεσμα. Μετά από αυτό, στην ομάδα εργαλείων "Βιβλιοθήκη συναρτήσεων" στην κορδέλα, κάντε κλικ στο κουμπί "Άλλες λειτουργίες". Εμφανίζεται μια λίστα στην οποία πρέπει να περάσετε διαδοχικά τα στοιχεία "Στατιστικά" και "ΜΕΣΟΣ".

Στη συνέχεια, ανοίγει ακριβώς το ίδιο παράθυρο ορισμάτων συνάρτησης, όπως όταν χρησιμοποιείτε τον Οδηγό συναρτήσεων, την εργασία στην οποία περιγράψαμε λεπτομερώς παραπάνω.

Τα επόμενα βήματα είναι ακριβώς τα ίδια.

Χειροκίνητη εισαγωγή λειτουργίας

Αλλά, μην ξεχνάτε ότι μπορείτε πάντα να εισάγετε τη λειτουργία "ΜΕΣΟΣ" χειροκίνητα εάν το επιθυμείτε. Θα έχει το ακόλουθο μοτίβο: "=AVERAGE(cell_range_address(number); cell_range_address(number)).

Φυσικά, αυτή η μέθοδος δεν είναι τόσο βολική όσο οι προηγούμενες και απαιτεί ορισμένες φόρμουλες να διατηρούνται στο μυαλό του χρήστη, αλλά είναι πιο ευέλικτη.

Υπολογισμός της μέσης τιμής κατά συνθήκη

Εκτός από τον συνήθη υπολογισμό της μέσης τιμής, είναι δυνατός ο υπολογισμός της μέσης τιμής ανά συνθήκη. Σε αυτήν την περίπτωση, θα ληφθούν υπόψη μόνο εκείνοι οι αριθμοί από το επιλεγμένο εύρος που πληρούν μια συγκεκριμένη προϋπόθεση. Για παράδειγμα, εάν αυτοί οι αριθμοί είναι μεγαλύτεροι ή μικρότεροι από μια συγκεκριμένη τιμή.

Για τους σκοπούς αυτούς, χρησιμοποιείται η συνάρτηση AVERAGEIF. Όπως και η συνάρτηση AVERAGE, μπορείτε να την εκτελέσετε μέσω του Function Wizard, από τη γραμμή τύπων ή εισάγοντάς την με μη αυτόματο τρόπο σε ένα κελί. Αφού ανοίξει το παράθυρο ορισμάτων συνάρτησης, πρέπει να εισαγάγετε τις παραμέτρους του. Στο πεδίο "Εύρος", εισαγάγετε το εύρος των κελιών των οποίων οι τιμές θα χρησιμοποιηθούν για τον προσδιορισμό του μέσου όρου αριθμητικός αριθμός. Αυτό το κάνουμε με τον ίδιο τρόπο όπως με τη συνάρτηση AVERAGE.

Και εδώ, στο πεδίο "Συνθήκη", πρέπει να καθορίσουμε μια συγκεκριμένη τιμή, αριθμούς μεγαλύτερους ή μικρότερους από αυτούς που θα συμπεριληφθούν στον υπολογισμό. Αυτό μπορεί να γίνει χρησιμοποιώντας σήματα σύγκρισης. Για παράδειγμα, πήραμε την έκφραση ">=15000". Δηλαδή, μόνο κελιά του εύρους που περιέχουν αριθμούς μεγαλύτερους ή ίσους με 15000 θα ληφθούν για υπολογισμό. Εάν είναι απαραίτητο, αντί για συγκεκριμένο αριθμό, εδώ μπορείτε να καθορίσετε τη διεύθυνση του κελιού στο οποίο βρίσκεται ο αντίστοιχος αριθμός.

Το πεδίο "Εύρος μέσου όρου" είναι προαιρετικό. Η εισαγωγή δεδομένων σε αυτό απαιτείται μόνο όταν χρησιμοποιείτε κελιά με περιεχόμενο κειμένου.

Όταν εισαχθούν όλα τα δεδομένα, κάντε κλικ στο κουμπί "OK".

Μετά από αυτό, το αποτέλεσμα του υπολογισμού του αριθμητικού μέσου όρου για το επιλεγμένο εύρος εμφανίζεται στο προεπιλεγμένο κελί, με εξαίρεση τα κελιά των οποίων τα δεδομένα δεν πληρούν τις προϋποθέσεις.

Όπως μπορείτε να δείτε, στο Microsoft Excel υπάρχει μια σειρά από εργαλεία με τα οποία μπορείτε να υπολογίσετε τη μέση τιμή μιας επιλεγμένης σειράς αριθμών. Επιπλέον, υπάρχει μια λειτουργία που επιλέγει αυτόματα αριθμούς από ένα εύρος που δεν πληρούν κριτήρια που καθορίζονται από τον χρήστη. Αυτό κάνει τους υπολογισμούς στο Microsoft Excel ακόμη πιο φιλικούς προς το χρήστη.

Θέμα: Στατιστικά

Επιλογή αριθμός 2

Μέσες τιμές που χρησιμοποιούνται στα στατιστικά στοιχεία

Εισαγωγή………………………………………………………………………………….3

Θεωρητικό έργο

Η μέση τιμή στα στατιστικά στοιχεία, η ουσία και οι συνθήκες εφαρμογής της.

1.1. Ουσία μεσαίο μέγεθοςκαι συνθήκες χρήσης………….4

1.2. Τύποι μέσων τιμών………………………………………………8

Πρακτική εργασία

Εργασία 1,2,3………………………………………………………………………… 14

Συμπέρασμα………………………………………………………………………….21

Κατάλογος χρησιμοποιημένης βιβλιογραφίας……………………………………………………………………………………………………………………

Εισαγωγή

Αυτό δοκιμήαποτελείται από δύο μέρη - θεωρητικό και πρακτικό. Στο θεωρητικό μέρος, μια τόσο σημαντική στατιστική κατηγορία όπως η μέση τιμή θα εξεταστεί λεπτομερώς για να προσδιοριστεί η ουσία και οι συνθήκες εφαρμογής της, καθώς και να προσδιοριστούν τα είδη των μέσων όρων και οι μέθοδοι υπολογισμού τους.

Η στατιστική, όπως γνωρίζετε, μελετά μαζικά κοινωνικοοικονομικά φαινόμενα. Κάθε ένα από αυτά τα φαινόμενα μπορεί να έχει διαφορετική ποσοτική έκφραση του ίδιου χαρακτηριστικού. Για παράδειγμα, οι μισθοί του ίδιου επαγγέλματος των εργαζομένων ή οι τιμές στην αγορά για το ίδιο προϊόν κ.λπ. Οι μέσες τιμές χαρακτηρίζουν δείκτες ποιότητας εμπορικές δραστηριότητες: κόστος διανομής, κέρδος, κερδοφορία κ.λπ.

Για τη μελέτη οποιουδήποτε πληθυσμού σύμφωνα με ποικίλα (ποσοτικά μεταβαλλόμενα) χαρακτηριστικά, η στατιστική χρησιμοποιεί μέσους όρους.

Medium Essence

Η μέση τιμή είναι ένα γενικευτικό ποσοτικό χαρακτηριστικό του συνόλου του ίδιου τύπου φαινομένων σύμφωνα με ένα διαφορετικό χαρακτηριστικό. Στην οικονομική πρακτική, χρησιμοποιείται ένα ευρύ φάσμα δεικτών, που υπολογίζονται ως μέσοι όροι.

Η πιο σημαντική ιδιότητα της μέσης τιμής είναι ότι αντιπροσωπεύει την τιμή ενός συγκεκριμένου χαρακτηριστικού σε ολόκληρο τον πληθυσμό ως ενιαίο αριθμό, παρά τις ποσοτικές διαφορές του σε μεμονωμένες μονάδες του πληθυσμού, και εκφράζει το κοινό πράγμα που είναι εγγενές σε όλες τις μονάδες τον υπό μελέτη πληθυσμό. Έτσι, μέσα από το χαρακτηριστικό μιας μονάδας πληθυσμού, χαρακτηρίζει ολόκληρο τον πληθυσμό ως σύνολο.

Οι μέσες τιμές σχετίζονται με το νόμο μεγάλα νούμερα. Η ουσία αυτής της σχέσης έγκειται στο γεγονός ότι κατά τον μέσο όρο των τυχαίων αποκλίσεων μεμονωμένων τιμών, λόγω της λειτουργίας του νόμου των μεγάλων αριθμών, αλληλοακυρώνονται και στο μέσο όρο αποκαλύπτεται η κύρια αναπτυξιακή τάση, η αναγκαιότητα, η κανονικότητα. Οι μέσες τιμές επιτρέπουν τη σύγκριση δεικτών που σχετίζονται με πληθυσμούς με διαφορετικούς αριθμούς μονάδων.

ΣΕ σύγχρονες συνθήκεςη ανάπτυξη των σχέσεων αγοράς στην οικονομία, οι μέσοι όροι χρησιμεύουν ως εργαλείο για τη μελέτη των αντικειμενικών προτύπων των κοινωνικοοικονομικών φαινομένων. Ωστόσο, η οικονομική ανάλυση δεν πρέπει να περιορίζεται μόνο στους μέσους όρους, καθώς οι γενικοί ευνοϊκοί μέσοι όροι μπορούν επίσης να κρύβουν μεγάλους σοβαρές ελλείψειςστις δραστηριότητες των επιμέρους οικονομικών φορέων, και τα βλαστάρια μιας νέας, προοδευτικής. Για παράδειγμα, η κατανομή του πληθυσμού ανά εισόδημα καθιστά δυνατό τον εντοπισμό του σχηματισμού νέων Κοινωνικές Ομάδες. Ως εκ τούτου, μαζί με τα μέσα στατιστικά δεδομένα, είναι απαραίτητο να ληφθούν υπόψη τα χαρακτηριστικά των επιμέρους μονάδων του πληθυσμού.

Η μέση τιμή είναι το αποτέλεσμα όλων των παραγόντων που επηρεάζουν το υπό μελέτη φαινόμενο. Δηλαδή, κατά τον υπολογισμό των μέσων τιμών, η επίδραση τυχαίων (διαταραχών, μεμονωμένων) παραγόντων αλληλοεξουδετερώνεται και, επομένως, είναι δυνατό να προσδιοριστεί το μοτίβο που είναι εγγενές στο υπό μελέτη φαινόμενο. Ο Adolf Quetelet τόνισε ότι η σημασία της μεθόδου των μέσων όρων έγκειται στη δυνατότητα μετάβασης από τον ενικό στο γενικό, από το τυχαίο στο κανονικό, και η ύπαρξη μέσων όρων είναι μια κατηγορία αντικειμενικής πραγματικότητας.

Η στατιστική μελετά μαζικά φαινόμενα και διαδικασίες. Κάθε ένα από αυτά τα φαινόμενα έχει τόσο κοινές για ολόκληρο το σύνολο όσο και ειδικές, μεμονωμένες ιδιότητες. Η διαφορά μεταξύ μεμονωμένων φαινομένων ονομάζεται παραλλαγή. Μια άλλη ιδιότητα των μαζικών φαινομένων είναι η εγγενής εγγύτητα των χαρακτηριστικών των επιμέρους φαινομένων. Άρα, η αλληλεπίδραση των στοιχείων του συνόλου οδηγεί στον περιορισμό της διακύμανσης τουλάχιστον μέρους των ιδιοτήτων τους. Αυτή η τάση υπάρχει αντικειμενικά. Είναι στην αντικειμενικότητά του ότι ο λόγος για την ευρύτερη εφαρμογή των μέσων τιμών στην πράξη και στη θεωρία βρίσκεται.

Η μέση τιμή στα στατιστικά είναι ένας γενικευμένος δείκτης που χαρακτηρίζει το τυπικό επίπεδο ενός φαινομένου σε συγκεκριμένες συνθήκες τόπου και χρόνου, αντικατοπτρίζοντας το μέγεθος μιας μεταβλητής ιδιότητας ανά μονάδα ενός ποιοτικά ομοιογενούς πληθυσμού.

Στην οικονομική πρακτική, χρησιμοποιείται ένα ευρύ φάσμα δεικτών, που υπολογίζονται ως μέσοι όροι.

Με τη βοήθεια της μεθόδου των μέσων όρων, η στατιστική λύνει πολλά προβλήματα.

Η κύρια τιμή των μέσων όρων είναι η γενικευτική τους λειτουργία, δηλαδή η αντικατάσταση πολλών διαφορετικών μεμονωμένων τιμών ενός χαρακτηριστικού από μια μέση τιμή που χαρακτηρίζει ολόκληρο το σύνολο των φαινομένων.

Εάν η μέση τιμή γενικεύει ποιοτικά ομοιογενείς τιμές ενός χαρακτηριστικού, τότε είναι τυπικό χαρακτηριστικό ενός χαρακτηριστικού σε έναν δεδομένο πληθυσμό.

Ωστόσο, είναι λάθος να μειώνουμε τον ρόλο των μέσων τιμών μόνο στον χαρακτηρισμό των τυπικών τιμών χαρακτηριστικών σε πληθυσμούς που είναι ομοιογενείς ως προς αυτό το χαρακτηριστικό. Στην πράξη, πολύ πιο συχνά οι σύγχρονες στατιστικές χρησιμοποιούν μέσους όρους που γενικεύουν σαφώς ομοιογενή φαινόμενα.

Η μέση αξία του κατά κεφαλήν εθνικού εισοδήματος, η μέση απόδοση των σιτηρών σε όλη τη χώρα, η μέση κατανάλωση διαφόρων τροφίμων είναι τα χαρακτηριστικά του κράτους ως ενιαίου οικονομικού συστήματος, αυτοί είναι οι λεγόμενοι μέσοι όροι του συστήματος.

Οι μέσοι όροι συστημάτων μπορούν να χαρακτηρίσουν τόσο χωρικά ή αντικειμενικά συστήματα που υπάρχουν ταυτόχρονα (πολιτεία, βιομηχανία, περιοχή, πλανήτης Γη, κ.λπ.) όσο και δυναμικά συστήματα που εκτείνονται με την πάροδο του χρόνου (έτος, δεκαετία, εποχή κ.λπ.).

Η πιο σημαντική ιδιότητα της μέσης τιμής είναι ότι αντικατοπτρίζει το κοινό που είναι εγγενές σε όλες τις μονάδες του υπό μελέτη πληθυσμού. Οι τιμές του χαρακτηριστικού των μεμονωμένων μονάδων του πληθυσμού κυμαίνονται προς τη μία ή την άλλη κατεύθυνση υπό την επίδραση πολλών παραγόντων, μεταξύ των οποίων μπορεί να υπάρχουν τόσο βασικοί όσο και τυχαίοι. Για παράδειγμα, η τιμή της μετοχής μιας εταιρείας στο σύνολό της καθορίζεται από αυτήν οικονομική θέση. Ταυτόχρονα, ορισμένες ημέρες και σε ορισμένα χρηματιστήρια, λόγω των συνθηκών που επικρατούν, οι μετοχές αυτές ενδέχεται να πωλούνται με υψηλότερη ή χαμηλότερη τιμή. Η ουσία του μέσου όρου έγκειται στο γεγονός ότι ακυρώνει τις αποκλίσεις των τιμών των χαρακτηριστικών μεμονωμένων μονάδων του πληθυσμού, λόγω της δράσης τυχαίων παραγόντων, και λαμβάνει υπόψη τις αλλαγές που προκαλούνται από τη δράση του κύριοι παράγοντες. Αυτό επιτρέπει στον μέσο όρο να αντικατοπτρίζει το τυπικό επίπεδο του χαρακτηριστικού και να αφαιρεί από τα επιμέρους χαρακτηριστικά που είναι εγγενή σε μεμονωμένες μονάδες.

Ο υπολογισμός του μέσου όρου είναι μια κοινή τεχνική γενίκευσης. μέση τιμήαντικατοπτρίζει ό,τι είναι κοινό (τυπικό) για όλες τις μονάδες του υπό μελέτη πληθυσμού, ταυτόχρονα αγνοεί τις διαφορές μεταξύ των επιμέρους μονάδων. Σε κάθε φαινόμενο και την εξέλιξή του υπάρχει ένας συνδυασμός τύχης και αναγκαιότητας.

Ο μέσος όρος είναι ένα συνοπτικό χαρακτηριστικό των κανονικοτήτων της διαδικασίας στις συνθήκες υπό τις οποίες προχωρά.

Κάθε μέσος όρος χαρακτηρίζει τον υπό μελέτη πληθυσμό σύμφωνα με οποιοδήποτε χαρακτηριστικό, αλλά για να χαρακτηριστεί οποιοσδήποτε πληθυσμός, να περιγραφούν τα τυπικά χαρακτηριστικά και τα ποιοτικά χαρακτηριστικά του, απαιτείται ένα σύστημα μέσων δεικτών. Ως εκ τούτου, στην πρακτική των εγχώριων στατιστικών για τη μελέτη κοινωνικο-οικονομικών φαινομένων, κατά κανόνα, υπολογίζεται ένα σύστημα μέσων δεικτών. Έτσι, για παράδειγμα, ο μέσος όρος μισθοίαξιολογούνται μαζί με δείκτες μέσης παραγωγής, αναλογίας κεφαλαίου-εργασίας και αναλογίας ισχύος προς εργασία, ο βαθμός μηχανοποίησης και αυτοματοποίησης της εργασίας κ.λπ.

Ο μέσος όρος θα πρέπει να υπολογίζεται λαμβάνοντας υπόψη το οικονομικό περιεχόμενο του υπό μελέτη δείκτη. Επομένως, για έναν συγκεκριμένο δείκτη που χρησιμοποιείται στην κοινωνικοοικονομική ανάλυση, μόνο μία πραγματική τιμή του μέσου όρου μπορεί να υπολογιστεί με βάση την επιστημονική μέθοδο υπολογισμού.

Η μέση τιμή είναι ένας από τους σημαντικότερους γενικευτικούς στατιστικούς δείκτες που χαρακτηρίζει το σύνολο του ίδιου τύπου φαινομένων σύμφωνα με κάποιο ποσοτικά μεταβαλλόμενο χαρακτηριστικό. Οι μέσοι όροι στα στατιστικά είναι γενικευτικοί δείκτες, αριθμοί που εκφράζουν τις τυπικές χαρακτηριστικές διαστάσεις των κοινωνικών φαινομένων σύμφωνα με ένα ποσοτικά μεταβαλλόμενο χαρακτηριστικό.

Τύποι μέσων όρων

Οι τύποι των μέσων τιμών διαφέρουν κυρίως ως προς το ποια ιδιότητα, ποια παράμετρος της αρχικής μεταβλητής μάζας των μεμονωμένων τιμών του χαρακτηριστικού πρέπει να διατηρείται αμετάβλητη.

Αριθμητικός μέσος όρος

Ο αριθμητικός μέσος όρος είναι μια τέτοια μέση τιμή ενός χαρακτηριστικού, στον υπολογισμό του οποίου ο συνολικός όγκος του χαρακτηριστικού στο σύνολο παραμένει αμετάβλητος. Διαφορετικά, μπορούμε να πούμε ότι ο αριθμητικός μέσος όρος είναι η μέση άθροιση. Όταν υπολογίζεται, ο συνολικός όγκος του χαρακτηριστικού κατανέμεται νοερά εξίσου σε όλες τις μονάδες του πληθυσμού.

Ο αριθμητικός μέσος όρος χρησιμοποιείται εάν είναι γνωστές οι τιμές του μέσου όρου του χαρακτηριστικού (x) και του αριθμού των μονάδων πληθυσμού με μια συγκεκριμένη τιμή χαρακτηριστικού (f).

Ο αριθμητικός μέσος όρος μπορεί να είναι απλός και σταθμισμένος.

απλός αριθμητικός μέσος όρος

Ένα απλό χρησιμοποιείται εάν κάθε τιμή χαρακτηριστικού x εμφανίζεται μία φορά, π.χ. για κάθε x, η τιμή χαρακτηριστικού είναι f=1 ή εάν τα αρχικά δεδομένα δεν είναι ταξινομημένα και δεν είναι γνωστό πόσες μονάδες έχουν συγκεκριμένες τιμές χαρακτηριστικών.

Ο τύπος για τον αριθμητικό μέσο όρο είναι απλός.

,

Αριθμητικός μέσος όρος - ένας στατιστικός δείκτης που δείχνει τη μέση τιμή ενός δεδομένου πίνακα δεδομένων. Ένας τέτοιος δείκτης υπολογίζεται ως κλάσμα, ο αριθμητής του οποίου είναι το άθροισμα όλων των τιμών του πίνακα και ο παρονομαστής είναι ο αριθμός τους. Ο αριθμητικός μέσος όρος είναι ένας σημαντικός συντελεστής που χρησιμοποιείται στους οικιακούς υπολογισμούς.

Η έννοια του συντελεστή

Ο αριθμητικός μέσος όρος είναι ένας στοιχειώδης δείκτης για τη σύγκριση δεδομένων και τον υπολογισμό μιας αποδεκτής τιμής. Για παράδειγμα, ένα κουτί μπύρας από έναν συγκεκριμένο κατασκευαστή πωλείται σε διαφορετικά καταστήματα. Αλλά σε ένα κατάστημα κοστίζει 67 ρούβλια, σε άλλο - 70 ρούβλια, στο τρίτο - 65 ρούβλια και στο τελευταίο - 62 ρούβλια. Υπάρχει ένα αρκετά μεγάλο εύρος τιμών, επομένως ο αγοραστής θα ενδιαφέρεται για το μέσο κόστος ενός κουτιού, έτσι ώστε όταν αγοράζει ένα προϊόν να μπορεί να συγκρίνει το κόστος του. Κατά μέσο όρο, ένα κουτάκι μπύρας στην πόλη έχει μια τιμή:

Μέση τιμή = (67 + 70 + 65 + 62) / 4 = 66 ρούβλια.

Γνωρίζοντας τη μέση τιμή, είναι εύκολο να προσδιορίσετε πού είναι κερδοφόρο να αγοράσετε αγαθά και πού θα πρέπει να πληρώσετε υπερβολικά.

Ο αριθμητικός μέσος όρος χρησιμοποιείται συνεχώς σε στατιστικούς υπολογισμούς σε περιπτώσεις όπου αναλύεται ένα ομοιογενές σύνολο δεδομένων. Στο παραπάνω παράδειγμα, αυτή είναι η τιμή ενός κουτιού μπύρας της ίδιας μάρκας. Ωστόσο, δεν μπορούμε να συγκρίνουμε την τιμή της μπύρας από διαφορετικούς κατασκευαστές ή τις τιμές της μπύρας και της λεμονάδας, καθώς στην περίπτωση αυτή η διάδοση των τιμών θα είναι μεγαλύτερη, η μέση τιμή θα είναι θολή και αναξιόπιστη και το ίδιο το νόημα των υπολογισμών θα παραμορφωθεί σε καρικατούρα" μέση θερμοκρασίαστο νοσοκομείο." Για τον υπολογισμό ετερογενών πινάκων δεδομένων, χρησιμοποιείται ο αριθμητικός σταθμισμένος μέσος όρος, όταν κάθε τιμή λαμβάνει τον δικό της συντελεστή στάθμισης.

Υπολογισμός του αριθμητικού μέσου όρου

Ο τύπος για τους υπολογισμούς είναι εξαιρετικά απλός:

P = (a1 + a2 + … an) / n,

όπου an είναι η τιμή της ποσότητας, n είναι ο συνολικός αριθμός των τιμών.

Σε τι μπορεί να χρησιμοποιηθεί αυτός ο δείκτης; Η πρώτη και προφανής χρήση του είναι στη στατιστική. Σχεδόν κάθε στατιστική μελέτη χρησιμοποιεί τον αριθμητικό μέσο όρο. Θα μπορούσε να είναι ΜΕΣΟΣ ΟΡΟΣ ΗΛΙΚΙΑΣγάμος στη Ρωσία, ο μέσος όρος βαθμολογίας σε ένα μάθημα για έναν μαθητή ή η μέση δαπάνη για είδη παντοπωλείου ανά ημέρα. Όπως προαναφέρθηκε, χωρίς να ληφθούν υπόψη τα βάρη, ο υπολογισμός των μέσων όρων μπορεί να δώσει περίεργες ή παράλογες τιμές.

Για παράδειγμα, ο πρόεδρος Ρωσική Ομοσπονδίαέκανε μια δήλωση ότι, σύμφωνα με στατιστικά στοιχεία, ο μέσος μισθός ενός Ρώσου είναι 27.000 ρούβλια. Για τους περισσότερους ανθρώπους στη Ρωσία, αυτό το επίπεδο μισθού φαινόταν παράλογο. Δεν αποτελεί έκπληξη εάν ο υπολογισμός λαμβάνει υπόψη τα εισοδήματα των ολιγαρχών, των επικεφαλής βιομηχανικών επιχειρήσεων, των μεγαλοτραπεζιτών, από τη μια και τους μισθούς των δασκάλων, των καθαριστριών και των πωλητών, από την άλλη. Ακόμη και οι μέσοι μισθοί σε μια ειδικότητα, για παράδειγμα, ένας λογιστής, θα έχουν σοβαρές διαφορές στη Μόσχα, την Κόστρομα και το Αικατερινούπολη.

Πώς να υπολογίσετε τους μέσους όρους για ετερογενή δεδομένα

Σε καταστάσεις μισθοδοσίας, είναι σημαντικό να λαμβάνεται υπόψη το βάρος κάθε αξίας. Αυτό σημαίνει ότι στους μισθούς των ολιγαρχών και των τραπεζιτών θα δίνεται βάρος, για παράδειγμα, 0,00001 και οι μισθοί των πωλητών θα είναι 0,12. Αυτοί είναι αριθμοί από το ανώτατο όριο, αλλά απεικονίζουν χονδρικά την επικράτηση των ολιγαρχών και των πωλητών στη ρωσική κοινωνία.

Έτσι, για να υπολογιστεί ο μέσος όρος των μέσων όρων ή η μέση τιμή σε έναν ετερογενή πίνακα δεδομένων, απαιτείται να χρησιμοποιηθεί ο αριθμητικός σταθμισμένος μέσος όρος. Διαφορετικά θα πάρετε μέσος μισθόςστη Ρωσία στο επίπεδο των 27.000 ρούβλια. Αν θέλετε να μάθετε το δικό σας μέσος βαθμόςστα μαθηματικά ή στον μέσο αριθμό τερμάτων που σημείωσε ο επιλεγμένος παίκτης χόκεϋ, τότε ο αριθμητικός μέσος υπολογιστής θα σας ταιριάζει.

Το πρόγραμμά μας είναι μια απλή και βολική αριθμομηχανή για τον υπολογισμό του αριθμητικού μέσου όρου. Χρειάζεται μόνο να εισαγάγετε τιμές παραμέτρων για να εκτελέσετε υπολογισμούς.

Ας δούμε μερικά παραδείγματα

Υπολογισμός Μέσου Βαθμού

Πολλοί δάσκαλοι χρησιμοποιούν τον αριθμητικό μέσο όρο για να καθορίσουν έναν ετήσιο βαθμό σε ένα μάθημα. Ας φανταστούμε ότι ένα παιδί παίρνει τους παρακάτω βαθμούς τριμήνου στα μαθηματικά: 3, 3, 5, 4. Τι ετήσιο βαθμό θα του δώσει ο δάσκαλος; Ας χρησιμοποιήσουμε μια αριθμομηχανή και ας υπολογίσουμε τον αριθμητικό μέσο όρο. Αρχικά, επιλέξτε τον κατάλληλο αριθμό πεδίων και εισαγάγετε τις τιμές βαθμού στα κελιά που εμφανίζονται:

(3 + 3 + 5 + 4) / 4 = 3,75

Ο δάσκαλος θα στρογγυλοποιήσει την τιμή υπέρ του μαθητή και ο μαθητής θα λάβει σταθερά τέσσερα για το έτος.

Υπολογισμός γλυκών που καταναλώθηκαν

Ας δείξουμε έναν παραλογισμό του αριθμητικού μέσου όρου. Φανταστείτε ότι η Μάσα και η Βόβα είχαν 10 γλυκά. Η Μάσα έφαγε 8 καραμέλες και η Βόβα μόνο 2. Πόσες καραμέλες έφαγε κάθε παιδί κατά μέσο όρο; Χρησιμοποιώντας μια αριθμομηχανή, είναι εύκολο να υπολογίσουμε ότι κατά μέσο όρο τα παιδιά έτρωγαν 5 γλυκά, κάτι που είναι εντελώς αναληθές και ΚΟΙΝΗ ΛΟΓΙΚΗ. Αυτό το παράδειγμα δείχνει ότι ο αριθμητικός μέσος όρος είναι σημαντικός για σημαντικά σύνολα δεδομένων.

συμπέρασμα

Ο υπολογισμός του αριθμητικού μέσου όρου χρησιμοποιείται ευρέως σε πολλά επιστημονικά πεδία. Αυτός ο δείκτης είναι δημοφιλής όχι μόνο στους στατιστικούς υπολογισμούς, αλλά και στη φυσική, τη μηχανική, την οικονομία, την ιατρική ή τη χρηματοδότηση. Χρησιμοποιήστε τις αριθμομηχανές μας ως βοηθό για την επίλυση προβλημάτων αριθμητικού μέσου όρου.

Στις περισσότερες περιπτώσεις, τα δεδομένα συγκεντρώνονται γύρω από κάποιο κεντρικό σημείο. Έτσι, για να περιγράψουμε οποιοδήποτε σύνολο δεδομένων, αρκεί να υποδείξουμε τη μέση τιμή. Εξετάστε διαδοχικά τρία αριθμητικά χαρακτηριστικά που χρησιμοποιούνται για την εκτίμηση της μέσης τιμής της κατανομής: αριθμητικός μέσος όρος, διάμεσος και τρόπος λειτουργίας.

Μέση τιμή

Ο αριθμητικός μέσος όρος (συχνά αναφέρεται απλώς ως μέσος όρος) είναι η πιο κοινή εκτίμηση του μέσου όρου μιας κατανομής. Είναι το αποτέλεσμα της διαίρεσης του αθροίσματος όλων των παρατηρούμενων αριθμητικών τιμών με τον αριθμό τους. Για ένα δείγμα αριθμών Χ 1, Χ 2, ..., Χn, ο μέσος όρος του δείγματος (σημειώνεται με το σύμβολο ) ισοδυναμεί \u003d (X 1 + X 2 + ... + Xn) / n, ή

πού είναι ο μέσος όρος του δείγματος, n- το μέγεθος του δείγματος, ΧΕγώi-ο στοιχείοδείγματα.

Λήψη σημείωσης σε ή μορφή, παραδείγματα σε μορφή

Εξετάστε το ενδεχόμενο να υπολογίσετε τον αριθμητικό μέσο όρο των πενταετών μέσων ετήσιων αποδόσεων 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου (Εικόνα 1).

Ρύζι. 1. Μέση ετήσια απόδοση 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου

Ο μέσος όρος του δείγματος υπολογίζεται ως εξής:

Αυτή είναι μια καλή απόδοση, ειδικά σε σύγκριση με την απόδοση 3-4% που έλαβαν οι καταθέτες τραπεζών ή πιστωτικών ενώσεων την ίδια χρονική περίοδο. Εάν ταξινομήσετε τις τιμές απόδοσης, είναι εύκολο να δείτε ότι οκτώ αμοιβαία κεφάλαια έχουν απόδοση πάνω από το μέσο όρο και επτά - κάτω από το μέσο όρο. Ο αριθμητικός μέσος όρος λειτουργεί ως σημείο ισορροπίας, έτσι ώστε τα κεφάλαια χαμηλού εισοδήματος να εξισορροπούν τα κεφάλαια υψηλού εισοδήματος. Όλα τα στοιχεία του δείγματος εμπλέκονται στον υπολογισμό του μέσου όρου. Κανένας από τους άλλους εκτιμητές του μέσου όρου κατανομής δεν έχει αυτήν την ιδιότητα.

Πότε να υπολογίσετε τον αριθμητικό μέσο όρο.Δεδομένου ότι ο αριθμητικός μέσος όρος εξαρτάται από όλα τα στοιχεία του δείγματος, η παρουσία ακραίων τιμών επηρεάζει σημαντικά το αποτέλεσμα. Σε τέτοιες περιπτώσεις, ο αριθμητικός μέσος όρος μπορεί να παραμορφώσει την έννοια των αριθμητικών δεδομένων. Επομένως, κατά την περιγραφή ενός συνόλου δεδομένων που περιέχει ακραίες τιμές, είναι απαραίτητο να υποδεικνύεται η διάμεσος ή ο αριθμητικός μέσος όρος και η διάμεσος. Για παράδειγμα, εάν η απόδοση του αμοιβαίου κεφαλαίου της Αναδυόμενης Ανάπτυξης της RS αφαιρεθεί από το δείγμα, ο μέσος όρος του δείγματος της απόδοσης των 14 κεφαλαίων μειώνεται σχεδόν κατά 1% σε 5,19%.

Διάμεσος

Η διάμεσος είναι η μεσαία τιμή ενός διατεταγμένου πίνακα αριθμών. Εάν ο πίνακας δεν περιέχει επαναλαμβανόμενους αριθμούς, τότε τα μισά στοιχεία του θα είναι μικρότερα και μισά περισσότερα από τη διάμεσο. Εάν το δείγμα περιέχει ακραίες τιμές, είναι προτιμότερο να χρησιμοποιηθεί η διάμεσος παρά ο αριθμητικός μέσος όρος για την εκτίμηση του μέσου όρου. Για να υπολογιστεί η διάμεσος ενός δείγματος, πρέπει πρώτα να ταξινομηθεί.

Αυτή η φόρμουλα είναι διφορούμενη. Το αποτέλεσμά του εξαρτάται από το αν ο αριθμός είναι άρτιος ή μονός. n:

  • Εάν το δείγμα περιέχει περιττός αριθμόςστοιχεία, η διάμεσος είναι (n+1)/2-ο στοιχείο.
  • Εάν το δείγμα περιέχει ζυγό αριθμό στοιχείων, η διάμεσος βρίσκεται μεταξύ των δύο μεσαίων στοιχείων του δείγματος και ισούται με τον αριθμητικό μέσο όρο που υπολογίζεται σε αυτά τα δύο στοιχεία.

Για να υπολογίσουμε τη διάμεση τιμή για ένα δείγμα 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου, πρέπει πρώτα να ταξινομήσουμε τα πρωτογενή δεδομένα (Εικόνα 2). Τότε η διάμεσος θα είναι απέναντι από τον αριθμό του μεσαίου στοιχείου του δείγματος. στο παράδειγμά μας με αριθμό 8. Το Excel έχει ειδική λειτουργία=MEDIAN(), που λειτουργεί και με μη ταξινομημένους πίνακες.

Ρύζι. 2. Διάμεσος 15 ταμεία

Έτσι, η διάμεσος είναι 6,5. Αυτό σημαίνει ότι τα μισά από τα κεφάλαια πολύ υψηλού κινδύνου δεν ξεπερνούν τα 6,5, ενώ τα άλλα μισά το κάνουν. Σημειώστε ότι η διάμεσος του 6,5 είναι ελαφρώς μεγαλύτερη από τη διάμεσο του 6,08.

Εάν αφαιρέσουμε την κερδοφορία του αμοιβαίου κεφαλαίου RS Emerging Growth από το δείγμα, τότε η διάμεση τιμή των υπόλοιπων 14 κεφαλαίων θα μειωθεί στο 6,2%, δηλαδή όχι τόσο σημαντικά όσο ο αριθμητικός μέσος όρος (Εικ. 3).

Ρύζι. 3. Διάμεσος 14 ταμεία

Μόδα

Ο όρος εισήχθη για πρώτη φορά από τον Pearson το 1894. Η μόδα είναι ο αριθμός που εμφανίζεται πιο συχνά στο δείγμα (το πιο μοδάτο). Η μόδα περιγράφει καλά, για παράδειγμα, την τυπική αντίδραση των οδηγών σε ένα σήμα κυκλοφορίας για διακοπή της κυκλοφορίας. Κλασικό παράδειγμαχρήση της μόδας - η επιλογή του μεγέθους της παραγόμενης παρτίδας παπουτσιών ή του χρώματος της ταπετσαρίας. Εάν μια διανομή έχει πολλαπλούς τρόπους λειτουργίας, τότε λέγεται ότι είναι πολυτροπική ή πολυτροπική (έχει δύο ή περισσότερες "κορυφές"). Η πολυτροπική κατανομή παρέχει σημαντικές πληροφορίες για τη φύση της υπό μελέτη μεταβλητής. Για παράδειγμα, σε κοινωνιολογικές έρευνες, εάν μια μεταβλητή αντιπροσωπεύει μια προτίμηση ή στάση απέναντι σε κάτι, τότε η πολυτροπικότητα θα μπορούσε να σημαίνει ότι υπάρχουν πολλές σαφώς διαφορετικές απόψεις. Η πολυτροπικότητα είναι επίσης ένας δείκτης ότι το δείγμα δεν είναι ομοιογενές και ότι οι παρατηρήσεις μπορεί να δημιουργηθούν από δύο ή περισσότερες «επικαλυπτόμενες» κατανομές. Σε αντίθεση με τον αριθμητικό μέσο όρο, οι ακραίες τιμές δεν επηρεάζουν τη λειτουργία. Για τυχαίες μεταβλητές που κατανέμονται συνεχώς, όπως οι μέσες ετήσιες αποδόσεις των αμοιβαίων κεφαλαίων, η λειτουργία μερικές φορές δεν υπάρχει καθόλου (ή δεν έχει νόημα). Δεδομένου ότι αυτοί οι δείκτες μπορούν να λάβουν μια ποικιλία τιμών, οι επαναλαμβανόμενες τιμές είναι εξαιρετικά σπάνιες.

τεταρτημόρια

Τα τεταρτημόρια είναι μέτρα που χρησιμοποιούνται πιο συχνά για την αξιολόγηση της κατανομής των δεδομένων κατά την περιγραφή των ιδιοτήτων μεγάλων αριθμητικών δειγμάτων. Ενώ η διάμεσος χωρίζει τον ταξινομημένο πίνακα στο μισό (50% των στοιχείων του πίνακα είναι λιγότερα από το διάμεσο και το 50% είναι μεγαλύτερα), τα τεταρτημόρια διαχωρίζουν το ταξινομημένο σύνολο δεδομένων σε τέσσερα μέρη. Οι τιμές Q 1 , διάμεσος και Q 3 είναι το 25ο, 50ο και 75ο εκατοστημόριο, αντίστοιχα. Το πρώτο τεταρτημόριο Q 1 είναι ένας αριθμός που χωρίζει το δείγμα σε δύο μέρη: το 25% των στοιχείων είναι μικρότερα από και το 75% είναι περισσότερα από το πρώτο τεταρτημόριο.

Το τρίτο τεταρτημόριο Q 3 είναι ένας αριθμός που χωρίζει επίσης το δείγμα σε δύο μέρη: το 75% των στοιχείων είναι μικρότερα από και το 25% είναι περισσότερα από το τρίτο τεταρτημόριο.

Για τον υπολογισμό τεταρτημορίων σε εκδόσεις του Excel πριν από το 2007, χρησιμοποιήθηκε η συνάρτηση =QUARTILE (πίνακας, τμήμα). Ξεκινώντας με το Excel 2010, ισχύουν δύο λειτουργίες:

  • =QUARTILE.ON (πίνακας, τμήμα)
  • =QUARTILE.EXC(πίνακας, μέρος)

Αυτές οι δύο λειτουργίες δίνουν λίγο διάφορες έννοιες(Εικ. 4). Για παράδειγμα, κατά τον υπολογισμό των τεταρτημορίων ενός δείγματος που περιέχει δεδομένα για τη μέση ετήσια απόδοση 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου, Q 1 = 1,8 ή -0,7 για QUARTILE.INC και QUARTILE.EXC, αντίστοιχα. Παρεμπιπτόντως, η συνάρτηση QUARTILE που χρησιμοποιήθηκε νωρίτερα αντιστοιχεί στη σύγχρονη συνάρτηση QUARTILE.ON. Για να υπολογίσετε τεταρτημόρια στο Excel χρησιμοποιώντας τους παραπάνω τύπους, ο πίνακας δεδομένων μπορεί να παραμείνει χωρίς σειρά.

Ρύζι. 4. Υπολογίστε τεταρτημόρια στο Excel

Να τονίσουμε ξανά. Το Excel μπορεί να υπολογίσει τεταρτημόρια για μονομεταβλητή διακριτές σειρές, που περιέχει τις τιμές μιας τυχαίας μεταβλητής. Ο υπολογισμός των τεταρτημορίων για μια κατανομή με βάση τη συχνότητα δίνεται στην παρακάτω ενότητα.

γεωμετρικό μέσο

Σε αντίθεση με τον αριθμητικό μέσο όρο, ο γεωμετρικός μέσος όρος μετρά πόσο έχει αλλάξει μια μεταβλητή με την πάροδο του χρόνου. Το γεωμετρικό μέσο είναι η ρίζα nου βαθμού από το προϊόν nτιμές (στο Excel, χρησιμοποιείται η συνάρτηση = CUGEOM):

σολ= (X 1 * X 2 * ... * X n) 1/n

Μια παρόμοια παράμετρος - ο γεωμετρικός μέσος όρος του ρυθμού απόδοσης - καθορίζεται από τον τύπο:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

Οπου R i- ποσοστό απόδοσης Εγώ-η χρονική περίοδος.

Για παράδειγμα, ας υποθέσουμε ότι η αρχική επένδυση είναι 100.000 $. Μέχρι το τέλος του πρώτου έτους, πέφτει στα 50.000 $ και μέχρι το τέλος του δεύτερου έτους, επανέρχεται στα αρχικά 100.000 $. Το ποσοστό απόδοσης αυτής της επένδυσης σε διάστημα δύο περίοδος έτους είναι ίση με 0, αφού το αρχικό και το τελικό ποσό των κεφαλαίων είναι ίσα μεταξύ τους. Ωστόσο, ο αριθμητικός μέσος όρος των ετήσιων ποσοστών απόδοσης είναι = (-0,5 + 1) / 2 = 0,25 ή 25%, δεδομένου ότι το ποσοστό απόδοσης το πρώτο έτος R 1 = (50.000 - 100.000) / 100.000 = -0,5 , και στο δεύτερο R 2 = (100.000 - 50.000) / 50.000 = 1. Ταυτόχρονα, ο γεωμετρικός μέσος όρος του ποσοστού απόδοσης για δύο χρόνια είναι: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Έτσι, ο γεωμετρικός μέσος όρος αντικατοπτρίζει με μεγαλύτερη ακρίβεια τη μεταβολή (ακριβέστερα, την απουσία αλλαγής) στον όγκο των επενδύσεων κατά τη διετία από τον αριθμητικό μέσο όρο.

Ενδιαφέροντα γεγονότα.Πρώτον, ο γεωμετρικός μέσος όρος θα είναι πάντα μικρότερος από τον αριθμητικό μέσο όρο των ίδιων αριθμών. Εκτός από την περίπτωση που όλοι οι αριθμοί που λαμβάνονται είναι ίσοι μεταξύ τους. Δεύτερον, λαμβάνοντας υπόψη τις ιδιότητες ορθογώνιο τρίγωνο, μπορείτε να καταλάβετε γιατί ο μέσος όρος ονομάζεται γεωμετρικός. Το ύψος ενός ορθογώνιου τριγώνου, χαμηλωμένο στην υποτείνουσα, είναι η μέση αναλογία μεταξύ των προεξοχών των ποδιών στην υποτείνουσα, και κάθε σκέλος είναι η μέση αναλογία μεταξύ της υποτείνουσας και της προβολής της στην υποτείνουσα (Εικ. 5). Αυτό δίνει έναν γεωμετρικό τρόπο κατασκευής του γεωμετρικού μέσου όρου δύο (μήκη) τμημάτων: πρέπει να χτίσετε έναν κύκλο στο άθροισμα αυτών των δύο τμημάτων ως διάμετρο και, στη συνέχεια, το ύψος, που θα αποκατασταθεί από το σημείο της σύνδεσής τους στη διασταύρωση με το κύκλος, θα δώσει την απαιτούμενη τιμή:

Ρύζι. 5. Η γεωμετρική φύση του γεωμετρικού μέσου (σχήμα από τη Wikipedia)

Η δεύτερη σημαντική ιδιότητα των αριθμητικών δεδομένων είναι το δικό τους παραλλαγήχαρακτηρίζοντας το βαθμό διασποράς των δεδομένων. Δύο διαφορετικά δείγματα μπορεί να διαφέρουν τόσο σε μέσες τιμές όσο και σε παραλλαγές. Ωστόσο, όπως φαίνεται στο σχ. 6 και 7, δύο δείγματα μπορεί να έχουν την ίδια παραλλαγή αλλά διαφορετικά μέσα ή τον ίδιο μέσο όρο και εντελώς διαφορετική παραλλαγή. Τα δεδομένα που αντιστοιχούν στο πολύγωνο Β στο Σχ. 7 αλλάζουν πολύ λιγότερο από τα δεδομένα από τα οποία κατασκευάστηκε το πολύγωνο Α.

Ρύζι. 6. Δύο συμμετρικές κατανομές σε σχήμα καμπάνας με το ίδιο spread και διαφορετικές μέσες τιμές

Ρύζι. 7. Δύο συμμετρικές κατανομές σε σχήμα καμπάνας με τις ίδιες μέσες τιμές και διαφορετική διασπορά

Υπάρχουν πέντε εκτιμήσεις της διακύμανσης των δεδομένων:

  • σπιθαμή,
  • διατεταρτημοριακό εύρος,
  • διασπορά,
  • τυπική απόκλιση,
  • ο συντελεστής διακύμανσης.

πεδίο εφαρμογής

Το εύρος είναι η διαφορά μεταξύ του μεγαλύτερου και του μικρότερου στοιχείου του δείγματος:

Σύρετε = XMax-XΕλάχ

Το εύρος ενός δείγματος που περιέχει τις μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου μπορεί να υπολογιστεί χρησιμοποιώντας έναν ταξινομημένο πίνακα (βλ. Εικόνα 4): εύρος = 18,5 - (-6,1) = 24,6. Αυτό σημαίνει ότι η διαφορά μεταξύ της υψηλότερης και της χαμηλότερης μέσης ετήσιας απόδοσης για αμοιβαία κεφάλαια πολύ υψηλού κινδύνου είναι 24,6%.

Το εύρος μετρά τη συνολική εξάπλωση των δεδομένων. Αν και το εύρος του δείγματος είναι μια πολύ απλή εκτίμηση της συνολικής εξάπλωσης των δεδομένων, η αδυναμία του είναι ότι δεν λαμβάνει υπόψη ακριβώς τον τρόπο κατανομής των δεδομένων μεταξύ του ελάχιστου και του μέγιστου στοιχείου. Αυτό το αποτέλεσμα φαίνεται καλά στο Σχ. 8 που απεικονίζει δείγματα που έχουν το ίδιο εύρος. Η κλίμακα Β δείχνει ότι εάν το δείγμα περιέχει τουλάχιστον μία ακραία τιμή, το εύρος του δείγματος είναι μια πολύ ανακριβής εκτίμηση της διασποράς των δεδομένων.

Ρύζι. 8. Σύγκριση τριών δειγμάτων με το ίδιο εύρος. το τρίγωνο συμβολίζει την υποστήριξη της ισορροπίας και η θέση του αντιστοιχεί στη μέση τιμή του δείγματος

Διατεταρτημοριακό εύρος

Το διατεταρτημόριο ή το μέσο εύρος είναι η διαφορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου του δείγματος:

Εύρος διατεταρτημορίου \u003d Q 3 - Q 1

Αυτή η τιμή καθιστά δυνατό να εκτιμηθεί η εξάπλωση του 50% των στοιχείων και να μην ληφθεί υπόψη η επίδραση των ακραίων στοιχείων. Το διατεταρτημόριο για ένα δείγμα που περιέχει δεδομένα για τις μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου μπορεί να υπολογιστεί χρησιμοποιώντας τα δεδομένα στο Σχήμα. 4 (για παράδειγμα, για τη συνάρτηση QUARTILE.EXC): Εύρος διατεταρτημορίου = 9,8 - (-0,7) = 10,5. Το διάστημα μεταξύ 9,8 και -0,7 αναφέρεται συχνά ως μεσαίο μισό.

Πρέπει να σημειωθεί ότι οι τιμές Q 1 και Q 3, και ως εκ τούτου το διατεταρτημόριο, δεν εξαρτώνται από την παρουσία ακραίων τιμών, καθώς ο υπολογισμός τους δεν λαμβάνει υπόψη καμία τιμή μικρότερη από Q 1 ή μεγαλύτερη από Q 3 . Τα συνολικά ποσοτικά χαρακτηριστικά, όπως η διάμεσος, το πρώτο και το τρίτο τεταρτημόριο και το διατεταρτημόριο, τα οποία δεν επηρεάζονται από ακραίες τιμές, ονομάζονται ισχυροί δείκτες.

Ενώ το εύρος και το διατεταρτημόριο εύρος παρέχουν μια εκτίμηση της συνολικής και της μέσης διασποράς του δείγματος, αντίστοιχα, καμία από αυτές τις εκτιμήσεις δεν λαμβάνει υπόψη ακριβώς τον τρόπο με τον οποίο κατανέμονται τα δεδομένα. Διακύμανση και τυπική απόκλισηαπαλλαγμένο από αυτό το μειονέκτημα. Αυτοί οι δείκτες σάς επιτρέπουν να αξιολογήσετε τον βαθμό διακύμανσης των δεδομένων γύρω από τον μέσο όρο. Διακύμανση δείγματοςείναι μια προσέγγιση του αριθμητικού μέσου όρου που υπολογίζεται από τις τετραγωνικές διαφορές μεταξύ κάθε στοιχείου δείγματος και του μέσου όρου του δείγματος. Για ένα δείγμα X 1 , X 2 , ... X n η διακύμανση του δείγματος (που συμβολίζεται με το σύμβολο S 2 δίνεται με τον ακόλουθο τύπο:

Γενικά, η διακύμανση του δείγματος είναι το άθροισμα των τετραγωνικών διαφορών μεταξύ των στοιχείων του δείγματος και του μέσου όρου του δείγματος, διαιρούμενο με μια τιμή ίση με το μέγεθος του δείγματος μείον ένα:

Οπου - αριθμητικός μέσος όρος, n- το μέγεθος του δείγματος, X i - Εγώ-ο δείγμα στοιχείου Χ. Στο Excel πριν από την έκδοση 2007 για υπολογισμούς διακύμανση δείγματοςχρησιμοποιήθηκε η συνάρτηση =VAR(), από την έκδοση 2010 χρησιμοποιείται η συνάρτηση =VAR.B().

Η πιο πρακτική και ευρέως αποδεκτή εκτίμηση της διασποράς δεδομένων είναι τυπική απόκλιση. Αυτός ο δείκτης συμβολίζεται με το σύμβολο S και ισούται με τετραγωνική ρίζααπό τη διακύμανση του δείγματος:

Στο Excel πριν από την έκδοση 2007, η συνάρτηση =STDEV() χρησιμοποιήθηκε για τον υπολογισμό της τυπικής απόκλισης, από την έκδοση 2010 χρησιμοποιείται η συνάρτηση =STDEV.B(). Για τον υπολογισμό αυτών των συναρτήσεων, ο πίνακας δεδομένων μπορεί να είναι μη ταξινομημένος.

Ούτε η διακύμανση του δείγματος ούτε η τυπική απόκλιση του δείγματος μπορεί να είναι αρνητικές. Η μόνη περίπτωση στην οποία οι δείκτες S 2 και S μπορούν να είναι μηδενικοί είναι εάν όλα τα στοιχεία του δείγματος είναι ίσα. Σε αυτή την εντελώς απίθανη περίπτωση, το εύρος και το εύρος του διατεταρτημορίου είναι επίσης μηδέν.

Τα αριθμητικά δεδομένα είναι εγγενώς ασταθή. Οποιαδήποτε μεταβλητή μπορεί να πάρει ένα σύνολο διαφορετικές αξίες. Για παράδειγμα, διαφορετικά αμοιβαία κεφάλαια έχουν διαφορετικούς δείκτεςκερδοφορία και ζημίες. Λόγω της μεταβλητότητας των αριθμητικών δεδομένων, είναι πολύ σημαντικό να μελετηθούν όχι μόνο εκτιμήσεις του μέσου όρου, οι οποίες έχουν αθροιστικό χαρακτήρα, αλλά και εκτιμήσεις της διακύμανσης, που χαρακτηρίζουν τη διασπορά των δεδομένων.

Η διακύμανση και η τυπική απόκλιση μας επιτρέπουν να εκτιμήσουμε την εξάπλωση των δεδομένων γύρω από τον μέσο όρο, με άλλα λόγια, να καθορίσουμε πόσα στοιχεία του δείγματος είναι λιγότερα από το μέσο όρο και πόσα είναι μεγαλύτερα. Η διασπορά έχει μερικές πολύτιμες μαθηματικές ιδιότητες. Ωστόσο, η τιμή του είναι το τετράγωνο μιας μονάδας μέτρησης - ένα τετραγωνικό ποσοστό, ένα τετραγωνικό δολάριο, μια τετραγωνική ίντσα κ.λπ. Επομένως, μια φυσική εκτίμηση της διακύμανσης είναι η τυπική απόκλιση, η οποία εκφράζεται στις συνήθεις μονάδες μέτρησης - ποσοστό εισοδήματος, δολάρια ή ίντσες.

Η τυπική απόκλιση σάς επιτρέπει να υπολογίσετε το μέγεθος της διακύμανσης των στοιχείων του δείγματος γύρω από τη μέση τιμή. Σχεδόν σε όλες τις περιπτώσεις, η πλειονότητα των παρατηρούμενων τιμών βρίσκεται εντός συν ή πλην μίας τυπικής απόκλισης από τη μέση τιμή. Επομένως, γνωρίζοντας τον αριθμητικό μέσο όρο των στοιχείων του δείγματος και την τυπική απόκλιση του δείγματος, είναι δυνατό να προσδιοριστεί το διάστημα στο οποίο ανήκει ο κύριος όγκος των δεδομένων.

Η τυπική απόκλιση των αποδόσεων σε 15 αμοιβαία κεφάλαια πολύ υψηλού κινδύνου είναι 6,6 (Εικόνα 9). Αυτό σημαίνει ότι η κερδοφορία του μεγαλύτερου μέρους των κεφαλαίων διαφέρει από τη μέση αξία κατά όχι περισσότερο από 6,6% (δηλαδή, κυμαίνεται στο εύρος από – Σ= 6,2 – 6,6 = –0,4 έως + Σ= 12,8). Μάλιστα, αυτό το διάστημα περιέχει μέση ετήσια απόδοση 53,3% (8 στα 15) πενταετίας.

Ρύζι. 9. Τυπική απόκλιση

Σημειώστε ότι κατά τη διαδικασία άθροισης των τετραγωνικών διαφορών, τα στοιχεία που είναι πιο μακριά από τη μέση κερδίζουν περισσότερο βάρος από τα στοιχεία που είναι πιο κοντά. Αυτή η ιδιότητα είναι ο κύριος λόγος για τον οποίο ο μέσος όρος χρησιμοποιείται συχνότερα για την εκτίμηση του μέσου όρου μιας κατανομής. αριθμητική τιμή.

Ο συντελεστής διακύμανσης

Σε αντίθεση με προηγούμενες εκτιμήσεις διασποράς, ο συντελεστής διακύμανσης είναι μια σχετική εκτίμηση. Μετριέται πάντα ως ποσοστό, όχι στις αρχικές μονάδες δεδομένων. Ο συντελεστής διακύμανσης, που συμβολίζεται με τα σύμβολα CV, μετρά τη διασπορά των δεδομένων γύρω από τη μέση τιμή. Ο συντελεστής διακύμανσης είναι ίσος με την τυπική απόκλιση διαιρούμενη με τον αριθμητικό μέσο όρο και πολλαπλασιαζόμενη επί 100%:

Οπου μικρό- τυπική απόκλιση δείγματος, - μέσος όρος δείγματος.

Ο συντελεστής διακύμανσης σας επιτρέπει να συγκρίνετε δύο δείγματα, τα στοιχεία των οποίων εκφράζονται σε διαφορετικές μονάδες μέτρησης. Για παράδειγμα, ο διαχειριστής μιας υπηρεσίας παράδοσης αλληλογραφίας σκοπεύει να αναβαθμίσει τον στόλο των φορτηγών. Κατά τη φόρτωση συσκευασιών, υπάρχουν δύο τύποι περιορισμών που πρέπει να ληφθούν υπόψη: το βάρος (σε λίβρες) και ο όγκος (σε κυβικά πόδια) κάθε συσκευασίας. Ας υποθέσουμε ότι σε ένα δείγμα 200 σακουλών, το μέσο βάρος είναι 26,0 λίβρες, η τυπική απόκλιση του βάρους είναι 3,9 λίβρες, ο μέσος όγκος συσκευασίας είναι 8,8 κυβικά πόδια και η τυπική απόκλιση του όγκου είναι 2,2 κυβικά πόδια. Πώς να συγκρίνετε το spread του βάρους και του όγκου των πακέτων;

Δεδομένου ότι οι μονάδες μέτρησης για το βάρος και τον όγκο διαφέρουν μεταξύ τους, ο διαχειριστής πρέπει να συγκρίνει τη σχετική διασπορά αυτών των τιμών. Ο συντελεστής διακύμανσης βάρους είναι CV W = 3,9 / 26,0 * 100% = 15%, και ο συντελεστής διακύμανσης όγκου CV V = 2,2 / 8,8 * 100% = 25% . Έτσι, η σχετική διασπορά των όγκων πακέτων είναι πολύ μεγαλύτερη από τη σχετική διασπορά των βαρών τους.

Φόρμα διανομής

Η τρίτη σημαντική ιδιότητα του δείγματος είναι η μορφή της κατανομής του. Αυτή η κατανομή μπορεί να είναι συμμετρική ή ασύμμετρη. Για να περιγραφεί το σχήμα μιας κατανομής, είναι απαραίτητο να υπολογιστεί ο μέσος όρος και η διάμεσος. Εάν αυτά τα δύο μέτρα είναι τα ίδια, η μεταβλητή λέγεται ότι είναι συμμετρικά κατανεμημένη. Εάν η μέση τιμή μιας μεταβλητής είναι μεγαλύτερη από τη διάμεσο, η κατανομή της έχει θετική λοξότητα (Εικ. 10). Εάν η διάμεσος είναι μεγαλύτερη από τη μέση, η κατανομή της μεταβλητής είναι αρνητικά λοξή. Η θετική λοξότητα εμφανίζεται όταν ο μέσος όρος αυξάνεται σε ασυνήθιστα υψηλές αξίες. Η αρνητική λοξότητα εμφανίζεται όταν ο μέσος όρος μειώνεται σε ασυνήθιστα μικρές τιμές. Μια μεταβλητή κατανέμεται συμμετρικά εάν δεν λάβει ακραίες τιμές προς οποιαδήποτε κατεύθυνση, έτσι ώστε οι μεγάλες και οι μικρές τιμές της μεταβλητής να αλληλοεξουδετερώνονται.

Ρύζι. 10. Τρεις τύποι διανομών

Τα δεδομένα που απεικονίζονται στην κλίμακα Α έχουν αρνητική λοξότητα. Αυτό το σχήμα δείχνει μια μακριά ουρά και μια αριστερή λοξή που προκαλείται από ασυνήθιστα μικρές τιμές. Αυτές οι εξαιρετικά μικρές τιμές μετατοπίζουν τη μέση τιμή προς τα αριστερά και γίνεται μικρότερη από τη διάμεση τιμή. Τα δεδομένα που εμφανίζονται στην κλίμακα Β κατανέμονται συμμετρικά. Το αριστερό και το δεξί μισό της κατανομής είναι οι κατοπτρικές τους εικόνες. Οι μεγάλες και οι μικρές τιμές εξισορροπούν η μία την άλλη και ο μέσος όρος και ο διάμεσος είναι ίσοι. Τα δεδομένα που εμφανίζονται στην κλίμακα Β έχουν θετική λοξότητα. Αυτό το σχήμα δείχνει μια μακριά ουρά και μια λοξή προς τα δεξιά, που προκαλούνται από την παρουσία ασυνήθιστα υψηλών τιμών. Αυτές οι πολύ μεγάλες τιμές μετατοπίζουν τον μέσο όρο προς τα δεξιά και γίνεται μεγαλύτερος από τον διάμεσο.

Στο Excel, μπορείτε να λάβετε περιγραφικά στατιστικά στοιχεία χρησιμοποιώντας το πρόσθετο Πακέτο ανάλυσης. Περάστε από το μενού ΔεδομέναΑνάλυση δεδομένων, στο παράθυρο που ανοίγει, επιλέξτε τη γραμμή Περιγραφικά στατιστικάκαι κάντε κλικ Εντάξει. Στο παράθυρο Περιγραφικά στατιστικάφροντίστε να υποδείξετε διάστημα εισαγωγής(Εικ. 11). Εάν θέλετε να δείτε περιγραφικά στατιστικά στοιχεία στο ίδιο φύλλο με τα αρχικά δεδομένα, επιλέξτε το κουμπί επιλογής διάστημα εξόδουκαι καθορίστε το κελί στο οποίο θέλετε να τοποθετήσετε την επάνω αριστερή γωνία των εμφανιζόμενων στατιστικών (στο παράδειγμά μας, $C$1). Εάν θέλετε να στείλετε δεδομένα σε ΝΕΟ ΦΥΛΛΟή μέσα καινούργιο βιβλίοαπλά επιλέξτε το κατάλληλο κουμπί επιλογής. Επιλέξτε το πλαίσιο δίπλα Τελικά στατιστικά στοιχεία. Προαιρετικά, μπορείτε επίσης να επιλέξετε Επίπεδο δυσκολίας,κ-ο μικρότερο καικ-ο μεγαλύτερος.

Εάν είναι σε κατάθεση Δεδομέναστην περιοχή Ανάλυσηδεν βλέπετε το εικονίδιο Ανάλυση δεδομένων, πρέπει πρώτα να εγκαταστήσετε το πρόσθετο Πακέτο ανάλυσης(βλ., για παράδειγμα,).

Ρύζι. 11. Περιγραφικά στατιστικά στοιχεία των πενταετών μέσων ετήσιων αποδόσεων κεφαλαίων με πολύ υψηλά επίπεδα κινδύνου, που υπολογίζονται με τη χρήση του πρόσθετου Ανάλυση δεδομένωνΠρογράμματα Excel

Το Excel υπολογίζει έναν αριθμό στατιστικών που συζητήθηκαν παραπάνω: μέσος όρος, διάμεσος, τρόπος, τυπική απόκλιση, διακύμανση, εύρος ( διάστημα), ελάχιστο, μέγιστο και μέγεθος δείγματος ( έλεγχος). Επιπλέον, το Excel υπολογίζει ορισμένα νέα στατιστικά στοιχεία για εμάς: τυπικό σφάλμα, κύρτωση και λοξότητα. τυπικό σφάλμαισούται με την τυπική απόκλιση διαιρούμενη με την τετραγωνική ρίζα του μεγέθους του δείγματος. ασυμμετρίαχαρακτηρίζει την απόκλιση από τη συμμετρία της κατανομής και είναι μια συνάρτηση που εξαρτάται από τον κύβο των διαφορών μεταξύ των στοιχείων του δείγματος και της μέσης τιμής. Η κούρτωση είναι ένα μέτρο της σχετικής συγκέντρωσης δεδομένων γύρω από τον μέσο όρο σε σχέση με τις ουρές της κατανομής και εξαρτάται από τις διαφορές μεταξύ του δείγματος και του μέσου όρου που αυξάνεται στην τέταρτη ισχύ.

Υπολογισμός περιγραφικών στατιστικών για το γενικό πληθυσμό

Ο μέσος όρος, η διασπορά και το σχήμα της κατανομής που συζητήθηκαν παραπάνω είναι χαρακτηριστικά που βασίζονται σε δείγμα. Ωστόσο, εάν το σύνολο δεδομένων περιέχει αριθμητικές μετρήσεις ολόκληρου του πληθυσμού, τότε οι παράμετροί του μπορούν να υπολογιστούν. Αυτές οι παράμετροι περιλαμβάνουν τον μέσο όρο, τη διακύμανση και την τυπική απόκλιση του πληθυσμού.

Αναμενόμενη αξίαισούται με το άθροισμα όλων των τιμών του γενικού πληθυσμού διαιρεμένο με τον όγκο του γενικού πληθυσμού:

Οπου µ - αναμενόμενη αξία, ΧΕγώ- Εγώ-η μεταβλητή παρατήρηση Χ, Ν- τον όγκο του γενικού πληθυσμού. Στο Excel για υπολογισμό μαθηματική προσδοκίαχρησιμοποιείται η ίδια συνάρτηση με τον αριθμητικό μέσο όρο: =AVERAGE().

Διακύμανση πληθυσμούίσο με το άθροισμα των τετραγωνικών διαφορών μεταξύ των στοιχείων του γενικού πληθυσμού και του ματ. προσδοκίες διαιρεμένες με το μέγεθος του πληθυσμού:

Οπου σ2είναι η διακύμανση του γενικού πληθυσμού. Το Excel πριν από την έκδοση 2007 χρησιμοποιεί τη συνάρτηση =VAR() για να υπολογίσει τη διακύμανση του πληθυσμού, ξεκινώντας από την έκδοση 2010 =VAR.G().

τυπική απόκλιση πληθυσμούισούται με την τετραγωνική ρίζα της διακύμανσης του πληθυσμού:

Το Excel πριν από την έκδοση 2007 χρησιμοποιεί το =STDEV() για τον υπολογισμό της τυπικής απόκλισης του πληθυσμού, ξεκινώντας με την έκδοση 2010 =STDEV.Y(). Σημειώστε ότι οι τύποι για τη διακύμανση πληθυσμού και την τυπική απόκλιση είναι διαφορετικοί από τους τύπους για τη διακύμανση του δείγματος και την τυπική απόκλιση. Κατά τον υπολογισμό των στατιστικών δειγμάτων S2Και μικρόο παρονομαστής του κλάσματος είναι n - 1, και κατά τον υπολογισμό των παραμέτρων σ2Και σ - τον όγκο του γενικού πληθυσμού Ν.

εμπειρικός κανόνας

Στις περισσότερες περιπτώσεις, ένα μεγάλο ποσοστό παρατηρήσεων συγκεντρώνεται γύρω από τη διάμεσο, σχηματίζοντας ένα σύμπλεγμα. Σε σύνολα δεδομένων με θετική λοξότητα, αυτό το σύμπλεγμα βρίσκεται στα αριστερά (δηλαδή, κάτω) της μαθηματικής προσδοκίας και σε σύνολα με αρνητική λοξότητα, αυτό το σύμπλεγμα βρίσκεται στα δεξιά (δηλαδή, πάνω) της μαθηματικής προσδοκίας. Τα συμμετρικά δεδομένα έχουν τον ίδιο μέσο όρο και διάμεσο, και οι παρατηρήσεις συγκεντρώνονται γύρω από το μέσο όρο, σχηματίζοντας μια κατανομή σε σχήμα καμπάνας. Εάν η κατανομή δεν έχει έντονη λοξότητα και τα δεδομένα συγκεντρώνονται γύρω από ένα συγκεκριμένο κέντρο βάρους, μπορεί να χρησιμοποιηθεί ένας εμπειρικός κανόνας για την εκτίμηση της μεταβλητότητας, ο οποίος λέει: εάν τα δεδομένα έχουν κατανομή σε σχήμα καμπάνας, τότε περίπου το 68% από τις παρατηρήσεις είναι μικρότερη από μία τυπική απόκλιση από τη μαθηματική προσδοκία, Περίπου το 95% των παρατηρήσεων είναι εντός δύο τυπικών αποκλίσεων από την αναμενόμενη τιμή και το 99,7% των παρατηρήσεων είναι εντός τριών τυπικών αποκλίσεων από την αναμενόμενη τιμή.

Έτσι, η τυπική απόκλιση, η οποία είναι μια εκτίμηση της μέσης διακύμανσης γύρω από τη μαθηματική προσδοκία, βοηθά στην κατανόηση του τρόπου κατανομής των παρατηρήσεων και στον προσδιορισμό των ακραίων τιμών. Από τον εμπειρικό κανόνα προκύπτει ότι για κατανομές σε σχήμα καμπάνας, μόνο μία τιμή στις είκοσι διαφέρει από τη μαθηματική προσδοκία κατά περισσότερες από δύο τυπικές αποκλίσεις. Επομένως, τιμές εκτός του διαστήματος μ ± 2σ, μπορούν να θεωρηθούν ακραίες τιμές. Επιπλέον, μόνο τρεις στις 1000 παρατηρήσεις διαφέρουν από τις μαθηματικές προσδοκίες κατά περισσότερες από τρεις τυπικές αποκλίσεις. Έτσι, τιμές εκτός του διαστήματος μ ± 3σείναι σχεδόν πάντα ακραίες. Για διανομές που είναι πολύ λοξές ή δεν έχουν σχήμα καμπάνας, μπορεί να εφαρμοστεί ο εμπειρικός κανόνας Biename-Chebyshev.

Πριν από περισσότερα από εκατό χρόνια, οι μαθηματικοί Bienamay και Chebyshev ανακάλυψαν ανεξάρτητα χρήσιμη ιδιότητατυπική απόκλιση. Βρήκαν ότι για οποιοδήποτε σύνολο δεδομένων, ανεξάρτητα από το σχήμα της κατανομής, το ποσοστό των παρατηρήσεων που βρίσκονται σε απόσταση που δεν υπερβαίνει κτυπικές αποκλίσεις από τις μαθηματικές προσδοκίες, όχι λιγότερες (1 – 1/ 2)*100%.

Για παράδειγμα, εάν κ= 2, ο κανόνας Biename-Chebyshev δηλώνει ότι τουλάχιστον (1 - (1/2) 2) x 100% = 75% των παρατηρήσεων πρέπει να βρίσκονται στο διάστημα μ ± 2σ. Αυτός ο κανόνας ισχύει για οποιονδήποτε κυπερβαίνει το ένα. Ο κανόνας Biename-Chebyshev είναι πολύ γενικό χαρακτήρακαι ισχύει για διανομές κάθε είδους. Υποδεικνύει τον ελάχιστο αριθμό παρατηρήσεων, η απόσταση από την οποία μέχρι τη μαθηματική προσδοκία δεν υπερβαίνει μια δεδομένη τιμή. Ωστόσο, εάν η κατανομή είναι σε σχήμα καμπάνας, ο εμπειρικός κανόνας εκτιμά με μεγαλύτερη ακρίβεια τη συγκέντρωση των δεδομένων γύρω από τη μέση τιμή.

Υπολογισμός περιγραφικών στατιστικών για μια κατανομή με βάση τη συχνότητα

Εάν τα αρχικά δεδομένα δεν είναι διαθέσιμα, η κατανομή συχνότητας γίνεται η μόνη πηγή πληροφοριών. Σε τέτοιες περιπτώσεις, μπορείτε να υπολογίσετε τις κατά προσέγγιση τιμές των ποσοτικών δεικτών της κατανομής, όπως ο αριθμητικός μέσος όρος, η τυπική απόκλιση, τα τεταρτημόρια.

Εάν τα δεδομένα του δείγματος παρουσιάζονται ως κατανομή συχνότητας, μπορεί να υπολογιστεί μια κατά προσέγγιση τιμή του αριθμητικού μέσου όρου, υποθέτοντας ότι όλες οι τιμές σε κάθε κατηγορία συγκεντρώνονται στο μέσο της κατηγορίας:

Οπου - μέσος όρος δείγματος, n- αριθμός παρατηρήσεων ή μέγεθος δείγματος, Με- τον αριθμό των κλάσεων στην κατανομή συχνότητας, mj- μεσαίο σημείο ι-η τάξη, φάι- συχνότητα που αντιστοιχεί σε ι-η τάξη.

Για τον υπολογισμό της τυπικής απόκλισης από την κατανομή συχνότητας, θεωρείται επίσης ότι όλες οι τιμές σε κάθε κατηγορία συγκεντρώνονται στο μέσο της κατηγορίας.

Για να κατανοήσουμε πώς καθορίζονται τα τεταρτημόρια της σειράς με βάση τις συχνότητες, ας εξετάσουμε τον υπολογισμό του κατώτερου τεταρτημορίου με βάση τα δεδομένα για το 2013 σχετικά με την κατανομή του ρωσικού πληθυσμού κατά μέσο κατά κεφαλήν εισόδημα σε μετρητά (Εικ. 12).

Ρύζι. 12. Το μερίδιο του πληθυσμού της Ρωσίας με μέσο κατά κεφαλήν εισόδημα σε μετρητάμέσος όρος ανά μήνα, ρούβλια

Για να υπολογίσετε το πρώτο τεταρτημόριο της σειράς παραλλαγής διαστήματος, μπορείτε να χρησιμοποιήσετε τον τύπο:

όπου Q1 είναι η τιμή του πρώτου τεταρτημορίου, xQ1 είναι το κατώτερο όριο του διαστήματος που περιέχει το πρώτο τεταρτημόριο (το διάστημα καθορίζεται από τη συσσωρευμένη συχνότητα, η πρώτη υπερβαίνει το 25%). i είναι η τιμή του διαστήματος. Σf είναι το άθροισμα των συχνοτήτων ολόκληρου του δείγματος. πιθανώς πάντα ίσο με 100%? SQ1–1 είναι η αθροιστική συχνότητα του διαστήματος που προηγείται του διαστήματος που περιέχει το κατώτερο τεταρτημόριο. fQ1 είναι η συχνότητα του διαστήματος που περιέχει το κατώτερο τεταρτημόριο. Ο τύπος για το τρίτο τεταρτημόριο διαφέρει στο ότι σε όλα τα μέρη, αντί για Q1, πρέπει να χρησιμοποιήσετε το Q3 και να αντικαταστήσετε το ¾ αντί για το ¼.

Στο παράδειγμά μας (Εικ. 12), το κατώτερο τεταρτημόριο είναι στην περιοχή 7000,1 - 10,000, η ​​αθροιστική συχνότητα του οποίου είναι 26,4%. Συμπέρασμααυτό το διάστημα είναι 7000 ρούβλια, η τιμή του διαστήματος είναι 3000 ρούβλια, η συσσωρευμένη συχνότητα του διαστήματος που προηγείται του διαστήματος που περιέχει το κάτω τεταρτημόριο είναι 13,4%, η συχνότητα του διαστήματος που περιέχει το κάτω τεταρτημόριο είναι 13,0%. Έτσι: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 ρούβλια.

Παγίδες που σχετίζονται με περιγραφικές στατιστικές

Σε αυτό το σημείωμα, εξετάσαμε πώς να περιγράψουμε ένα σύνολο δεδομένων χρησιμοποιώντας διάφορα στατιστικά στοιχεία που εκτιμούν τον μέσο όρο, τη διασπορά και την κατανομή του. Το επόμενο βήμα είναι η ανάλυση και η ερμηνεία των δεδομένων. Μέχρι στιγμής, μελετήσαμε τις αντικειμενικές ιδιότητες των δεδομένων και τώρα στραφούμε στην υποκειμενική ερμηνεία τους. Δύο λάθη περιμένουν τον ερευνητή: ένα εσφαλμένα επιλεγμένο θέμα ανάλυσης και μια εσφαλμένη ερμηνεία των αποτελεσμάτων.

Η ανάλυση της απόδοσης 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου είναι αρκετά αμερόληπτη. Οδήγησε σε εντελώς αντικειμενικά συμπεράσματα: όλα τα αμοιβαία κεφάλαια έχουν διαφορετικές αποδόσεις, το spread των αποδόσεων των αμοιβαίων κεφαλαίων κυμαίνεται από -6,1 έως 18,5 και η μέση απόδοση είναι 6,08. Εξασφαλίζεται η αντικειμενικότητα της ανάλυσης δεδομένων η σωστή επιλογήσυνολικούς ποσοτικούς δείκτες κατανομής. Εξετάστηκαν διάφορες μέθοδοι για την εκτίμηση του μέσου όρου και της διασποράς των δεδομένων και αναφέρθηκαν τα πλεονεκτήματα και τα μειονεκτήματά τους. Πώς να επιλέξετε τα σωστά στατιστικά στοιχεία που παρέχουν μια αντικειμενική και αμερόληπτη ανάλυση; Εάν η κατανομή των δεδομένων είναι ελαφρώς λοξή, πρέπει να επιλεγεί η διάμεσος έναντι του αριθμητικού μέσου όρου; Ποιος δείκτης χαρακτηρίζει με μεγαλύτερη ακρίβεια την εξάπλωση των δεδομένων: τυπική απόκλιση ή εύρος; Πρέπει να αναφέρεται η θετική λοξότητα της κατανομής;

Από την άλλη πλευρά, η ερμηνεία δεδομένων είναι μια υποκειμενική διαδικασία. Διαφορετικοί άνθρωποικαταλήγουν σε διαφορετικά συμπεράσματα, ερμηνεύοντας τα ίδια αποτελέσματα. Ο καθένας έχει τη δική του άποψη. Κάποιος θεωρεί ότι οι συνολικές μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων με πολύ υψηλό επίπεδο κινδύνου είναι καλές και είναι αρκετά ικανοποιημένος με το εισόδημα που εισπράττει. Άλλοι μπορεί να πιστεύουν ότι αυτά τα κεφάλαια έχουν πολύ χαμηλές αποδόσεις. Έτσι, η υποκειμενικότητα θα πρέπει να αντισταθμίζεται από την ειλικρίνεια, την ουδετερότητα και τη σαφήνεια των συμπερασμάτων.

Ηθικά ζητήματα

Η ανάλυση δεδομένων είναι άρρηκτα συνδεδεμένη με ηθικά ζητήματα. Κάποιος πρέπει να είναι επικριτικός απέναντι στις πληροφορίες που διαδίδονται από τις εφημερίδες, το ραδιόφωνο, την τηλεόραση και το Διαδίκτυο. Με τον καιρό, θα μάθετε να είστε δύσπιστοι όχι μόνο για τα αποτελέσματα, αλλά και για τους στόχους, το αντικείμενο και την αντικειμενικότητα της έρευνας. Ο διάσημος Βρετανός πολιτικός Benjamin Disraeli το είπε καλύτερα: «Υπάρχουν τρία είδη ψεμάτων: ψέματα, καταραμένα ψέματα και στατιστικές».

Όπως σημειώνεται στη σημείωση, προκύπτουν ηθικά ζητήματα κατά την επιλογή των αποτελεσμάτων που πρέπει να παρουσιάζονται στην έκθεση. Θα πρέπει να δημοσιεύονται τόσο τα θετικά όσο και τα αρνητικά αποτελέσματα. Επιπλέον, όταν κάνετε μια αναφορά ή γραπτή αναφορά, τα αποτελέσματα πρέπει να παρουσιάζονται ειλικρινά, ουδέτερα και αντικειμενικά. Διακρίνετε τις κακές και τις ανέντιμες παρουσιάσεις. Για να γίνει αυτό, είναι απαραίτητο να προσδιοριστούν ποιες ήταν οι προθέσεις του ομιλητή. Μερικές φορές ο ομιλητής παραλείπει σημαντικές πληροφορίες από άγνοια, και μερικές φορές εσκεμμένα (για παράδειγμα, εάν χρησιμοποιεί τον αριθμητικό μέσο όρο για να εκτιμήσει τον μέσο όρο των σαφώς λοξών δεδομένων για να πάρει το επιθυμητό αποτέλεσμα). Είναι επίσης ανέντιμο να καταστείλουμε αποτελέσματα που δεν ανταποκρίνονται στην άποψη του ερευνητή.

Χρησιμοποιούνται υλικά από το βιβλίο Levin et al Στατιστικά για μάνατζερ. - Μ.: Williams, 2004. - Σελ. 178–209

Η συνάρτηση QUARTILE διατηρήθηκε για ευθυγράμμιση με προηγούμενες εκδόσεις του Excel

Στα μαθηματικά, ο αριθμητικός μέσος όρος των αριθμών (ή απλά ο μέσος όρος) είναι το άθροισμα όλων των αριθμών σε ένα δεδομένο σύνολο διαιρεμένο με τον αριθμό τους. Αυτή είναι η πιο γενικευμένη και διαδεδομένη έννοια της μέσης τιμής. Όπως καταλάβατε ήδη, για να βρείτε, πρέπει να αθροίσετε όλους τους αριθμούς που σας δίνονται και να διαιρέσετε το αποτέλεσμα με τον αριθμό των όρων.

Τι είναι ο αριθμητικός μέσος όρος;

Ας δούμε ένα παράδειγμα.

Παράδειγμα 1. Δίνονται οι αριθμοί: 6, 7, 11. Πρέπει να βρείτε τη μέση τιμή τους.

Λύση.

Αρχικά, ας βρούμε το άθροισμα όλων των δεδομένων αριθμών.

Τώρα διαιρούμε το άθροισμα που προκύπτει με τον αριθμό των όρων. Εφόσον έχουμε τρεις όρους, αντίστοιχα, θα διαιρέσουμε με τρεις.

Επομένως, ο μέσος όρος των 6, 7 και 11 είναι 8. Γιατί 8; Ναι, γιατί το άθροισμα των 6, 7 και 11 θα είναι ίδιο με τρία οκτώ. Αυτό φαίνεται ξεκάθαρα στην εικόνα.

Η μέση τιμή θυμίζει κάπως την «ευθυγράμμιση» μιας σειράς αριθμών. Όπως μπορείτε να δείτε, οι σωροί από μολύβια έχουν γίνει ένα επίπεδο.

Εξετάστε ένα άλλο παράδειγμα για να εδραιώσετε τη γνώση που αποκτήθηκε.

Παράδειγμα 2Δίνονται οι αριθμοί: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Πρέπει να βρείτε τον αριθμητικό μέσο όρο τους.

Λύση.

Βρίσκουμε το άθροισμα.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Διαιρέστε με τον αριθμό των όρων (στην περίπτωση αυτή, 15).

Επομένως, η μέση τιμή αυτής της σειράς αριθμών είναι 22.

Τώρα σκεφτείτε αρνητικούς αριθμούς. Ας θυμηθούμε πώς να τα συνοψίσουμε. Για παράδειγμα, έχετε δύο αριθμούς 1 και -4. Ας βρούμε το άθροισμά τους.

1 + (-4) = 1 - 4 = -3

Γνωρίζοντας αυτό, εξετάστε ένα άλλο παράδειγμα.

Παράδειγμα 3Βρείτε τη μέση τιμή μιας σειράς αριθμών: 3, -7, 5, 13, -2.

Λύση.

Εύρεση του αθροίσματος των αριθμών.

3 + (-7) + 5 + 13 + (-2) = 12

Επειδή υπάρχουν 5 όροι, διαιρούμε το άθροισμα που προκύπτει με το 5.

Επομένως, ο αριθμητικός μέσος όρος των αριθμών 3, -7, 5, 13, -2 είναι 2,4.

Στην εποχή της τεχνολογικής προόδου μας, είναι πολύ πιο βολικό να το χρησιμοποιήσουμε για να βρούμε τη μέση τιμή προγράμματα υπολογιστή. Το Microsoft Office Excel είναι ένα από αυτά. Η εύρεση του μέσου όρου στο Excel είναι γρήγορη και εύκολη. Επιπλέον, αυτό το πρόγραμμα περιλαμβάνεται στο πακέτο λογισμικού από το Microsoft Office. Ας εξετάσουμε μια σύντομη οδηγία, αξία χρησιμοποιώντας αυτό το πρόγραμμα.

Για να υπολογίσετε τη μέση τιμή μιας σειράς αριθμών, πρέπει να χρησιμοποιήσετε τη συνάρτηση AVERAGE. Η σύνταξη αυτής της συνάρτησης είναι:
=Μέσος όρος(όρισμα1, όρισμα2, ... επιχείρημα255)
όπου το όρισμα1, το όρισμα2, το ... το όρισμα255 είναι είτε αριθμοί είτε αναφορές κελιών (τα κελιά σημαίνουν εύρη και πίνακες).

Για να γίνει πιο σαφές, ας δοκιμάσουμε τις γνώσεις που αποκτήθηκαν.

  1. Εισαγάγετε τους αριθμούς 11, 12, 13, 14, 15, 16 στα κελιά C1 - C6.
  2. Επιλέξτε το κελί C7 κάνοντας κλικ σε αυτό. Σε αυτό το κελί, θα εμφανίσουμε τη μέση τιμή.
  3. Κάντε κλικ στην καρτέλα "Τύποι".
  4. Επιλέξτε Περισσότερες λειτουργίες > Στατιστικά για να ανοίξετε
  5. Επιλέξτε ΜΕΣΟΣ. Μετά από αυτό, θα πρέπει να ανοίξει ένα πλαίσιο διαλόγου.
  6. Επιλέξτε και σύρετε τα κελιά C1-C6 εκεί για να ορίσετε την περιοχή στο πλαίσιο διαλόγου.
  7. Επιβεβαιώστε τις ενέργειές σας με το κουμπί "OK".
  8. Εάν τα κάνατε όλα σωστά, στο κελί C7 θα πρέπει να έχετε την απάντηση - 13.7. Όταν κάνετε κλικ στο κελί C7, η συνάρτηση (=Average(C1:C6)) θα εμφανιστεί στη γραμμή τύπων.

Είναι πολύ χρήσιμο να χρησιμοποιείτε αυτή τη λειτουργία για λογιστικά, τιμολόγια ή όταν χρειάζεται απλώς να βρείτε τον μέσο όρο ενός πολύ μεγάλου εύρους αριθμών. Ως εκ τούτου, χρησιμοποιείται συχνά σε γραφεία και μεγάλες εταιρείες. Αυτό σας επιτρέπει να διατηρείτε τα αρχεία σε τάξη και καθιστά δυνατό να υπολογίσετε γρήγορα κάτι (για παράδειγμα, το μέσο εισόδημα ανά μήνα). Μπορείτε επίσης να χρησιμοποιήσετε το Excel για να βρείτε τη μέση τιμή μιας συνάρτησης.