Πώς να υπολογίσετε τον αριθμητικό μέσο όρο. Μέσες τιμές και δείκτες διακύμανσης

Κάθε άτομο μέσα σύγχρονος κόσμος, σχεδιάζοντας να συνάψετε ένα δάνειο ή να αποθηκεύσετε λαχανικά για το χειμώνα, αντιμετωπίζει περιοδικά μια έννοια όπως "μέσος όρος". Ας μάθουμε: τι είναι, ποιοι τύποι και κατηγορίες υπάρχουν και γιατί χρησιμοποιείται σε στατιστικές και άλλους κλάδους.

Μέση τιμή - τι είναι;

Ένα παρόμοιο όνομα (SV) είναι ένα γενικευμένο χαρακτηριστικό ενός συνόλου ομοιογενών φαινομένων, που προσδιορίζεται από οποιοδήποτε χαρακτηριστικό ποσοτικής μεταβλητής.

Ωστόσο, οι άνθρωποι μακριά από τόσο δυσνόητους ορισμούς κατανοούν αυτήν την έννοια ως μια μέση ποσότητα κάτι. Για παράδειγμα, πριν πάρει ένα δάνειο, ένας τραπεζικός υπάλληλος θα ζητήσει οπωσδήποτε από έναν πιθανό πελάτη να παράσχει στοιχεία για το μέσο εισόδημα για το έτος, δηλαδή το συνολικό χρηματικό ποσό που κερδίζει ένα άτομο. Υπολογίζεται αθροίζοντας τα κέρδη για ολόκληρο το έτος και διαιρώντας με τον αριθμό των μηνών. Έτσι, η τράπεζα θα είναι σε θέση να προσδιορίσει εάν ο πελάτης της θα είναι σε θέση να αποπληρώσει το χρέος εγκαίρως.

Γιατί χρησιμοποιείται;

Κατά κανόνα, οι μέσες τιμές χρησιμοποιούνται ευρέως για να δοθεί ένας τελικός χαρακτηρισμός ορισμένων κοινωνικών φαινομένων που είναι μαζικής φύσης. Μπορούν επίσης να χρησιμοποιηθούν για μικρότερους υπολογισμούς, όπως στην περίπτωση δανείου, στο παραπάνω παράδειγμα.

Ωστόσο, τις περισσότερες φορές οι μέσοι όροι εξακολουθούν να χρησιμοποιούνται για παγκόσμιους σκοπούς. Ένα παράδειγμα από αυτά είναι ο υπολογισμός της ποσότητας ηλεκτρικής ενέργειας που καταναλώνουν οι πολίτες κατά τη διάρκεια ενός ημερολογιακού μήνα. Με βάση τα δεδομένα που ελήφθησαν, στη συνέχεια καθορίζονται ανώτατα όρια για τις κατηγορίες του πληθυσμού που απολαμβάνουν οφέλη από το κράτος.

Επίσης, με τη βοήθεια των μέσων τιμών, αναπτύσσεται η περίοδος εγγύησης για το σέρβις ορισμένων οικιακών συσκευών, αυτοκινήτων, κτιρίων κλπ. Με βάση τα δεδομένα που συλλέγονται με αυτόν τον τρόπο, αναπτύχθηκαν κάποτε σύγχρονα πρότυπα εργασίας και ανάπαυσης. .

Στην πραγματικότητα, κάθε φαινόμενο της σύγχρονης ζωής, που έχει μαζικό χαρακτήρα, συνδέεται με τον ένα ή τον άλλο τρόπο αναγκαστικά με την υπό εξέταση έννοια.

Εφαρμογές

Το φαινόμενο αυτό χρησιμοποιείται ευρέως σε όλες σχεδόν τις ακριβείς επιστήμες, ιδιαίτερα σε εκείνες που έχουν πειραματικό χαρακτήρα.

Η εύρεση του μέσου όρου έχει μεγάλη σημασία στην ιατρική, τη μηχανική, τη μαγειρική, την οικονομία, την πολιτική κ.λπ.

Με βάση τα δεδομένα που προκύπτουν από τέτοιες γενικεύσεις, αναπτύσσουν ιατρικά σκευάσματα, εκπαιδευτικά προγράμματα, καθορίζουν ελάχιστους μισθούς διαβίωσης και ημερομίσθια, κατασκευάζουν εκπαιδευτικά προγράμματα, παράγουν έπιπλα, ρούχα και παπούτσια, είδη υγιεινής και πολλά άλλα.

Στα μαθηματικά, ο όρος αυτός ονομάζεται «μέση τιμή» και χρησιμοποιείται για την εφαρμογή αποφάσεων διάφορα παραδείγματακαι καθήκοντα. Τα πιο απλά από αυτά είναι η πρόσθεση και η αφαίρεση με συνηθισμένα κλάσματα. Άλλωστε, όπως γνωρίζετε, για να λύσουμε τέτοια παραδείγματα, είναι απαραίτητο να φέρουμε και τα δύο κλάσματα σε έναν κοινό παρονομαστή.

Επίσης, στη βασίλισσα των ακριβών επιστημών χρησιμοποιείται συχνά ο όρος «μέση τιμή μιας τυχαίας μεταβλητής», που είναι κοντά σε νόημα. Για τους περισσότερους, είναι πιο οικείο ως "προσδοκία", που θεωρείται πιο συχνά στη θεωρία πιθανοτήτων. Αξίζει να σημειωθεί ότι παρόμοιο φαινόμενο ισχύει και κατά την εκτέλεση στατιστικών υπολογισμών.

Μέση τιμή στα στατιστικά στοιχεία

Ωστόσο, τις περισσότερες φορές η υπό μελέτη έννοια χρησιμοποιείται στις στατιστικές. Όπως είναι γνωστό, αυτή η επιστήμη από μόνη της ειδικεύεται στον υπολογισμό και την ανάλυση των ποσοτικών χαρακτηριστικών μαζικών κοινωνικών φαινομένων. Ως εκ τούτου, η μέση τιμή στα στατιστικά χρησιμοποιείται ως μια εξειδικευμένη μέθοδος για την επίτευξη των κύριων στόχων της - τη συλλογή και ανάλυση πληροφοριών.

Η ουσία αυτής της στατιστικής μεθόδου είναι να αντικαταστήσει τις μεμονωμένες μοναδικές τιμές του υπό εξέταση χαρακτηριστικού με μια ορισμένη ισορροπημένη μέση τιμή.

Ένα παράδειγμα είναι το διάσημο αστείο για φαγητό. Έτσι, σε ένα συγκεκριμένο εργοστάσιο τις Τρίτες για μεσημεριανό γεύμα, τα αφεντικά του τρώνε συνήθως κατσαρόλα με κρέας και οι απλοί εργάτες τρώνε λάχανο βραστό. Με βάση αυτά τα δεδομένα, μπορούμε να συμπεράνουμε ότι, κατά μέσο όρο, το προσωπικό του εργοστασίου δειπνεί σε ρολά λάχανου τις Τρίτες.

Αν και αυτό το παράδειγμα είναι ελαφρώς υπερβολικό, δείχνει το κύριο μειονέκτημα της μεθόδου αναζήτησης μέσης τιμής - την ισοπέδωση των επιμέρους χαρακτηριστικών αντικειμένων ή προσωπικοτήτων.

Οι μέσοι όροι χρησιμοποιούνται όχι μόνο για την ανάλυση των συλλεγόμενων πληροφοριών, αλλά και για τον σχεδιασμό και την πρόβλεψη περαιτέρω ενεργειών.

Χρησιμοποιείται επίσης για την αξιολόγηση των επιτευχθέντων αποτελεσμάτων (για παράδειγμα, η εφαρμογή του σχεδίου για την καλλιέργεια και τη συγκομιδή σιταριού για την περίοδο άνοιξη-καλοκαίρι).

Πώς να υπολογίσετε

Αν και, ανάλογα με τον τύπο του βιογραφικού, υπάρχουν διαφορετικοί τύποι για τον υπολογισμό του, στη γενική θεωρία της στατιστικής, κατά κανόνα, χρησιμοποιείται μόνο μία μέθοδος για τον υπολογισμό της μέσης τιμής ενός χαρακτηριστικού. Για να γίνει αυτό, πρέπει πρώτα να προσθέσετε μαζί τις τιμές όλων των φαινομένων και, στη συνέχεια, να διαιρέσετε το άθροισμα που προκύπτει με τον αριθμό τους.

Όταν κάνετε τέτοιους υπολογισμούς, αξίζει να θυμάστε ότι η μέση τιμή έχει πάντα την ίδια διάσταση (ή μονάδες) με μια ξεχωριστή μονάδα του πληθυσμού.

Προϋποθέσεις για τον σωστό υπολογισμό

Ο τύπος που συζητήθηκε παραπάνω είναι πολύ απλός και καθολικός, επομένως είναι σχεδόν αδύνατο να κάνετε λάθος σε αυτόν. Ωστόσο, αξίζει πάντα να εξετάζονται δύο πτυχές, διαφορετικά τα δεδομένα που λαμβάνονται δεν θα αντικατοπτρίζουν την πραγματική κατάσταση.


Μαθήματα CB

Έχοντας βρει απαντήσεις στις κύριες ερωτήσεις: "Η μέση τιμή - ποια είναι;", "Πού χρησιμοποιείται;" και «Πώς μπορώ να το υπολογίσω;», αξίζει να γνωρίζετε ποιες κατηγορίες και είδη CB υπάρχουν.

Πρώτα απ 'όλα, αυτό το φαινόμενο χωρίζεται σε 2 κατηγορίες. Αυτοί είναι δομικοί και μέσοι όροι ισχύος.

Τύποι ισχύος SW

Κάθε μία από τις παραπάνω κατηγορίες, με τη σειρά της, χωρίζεται σε τύπους. Η κατηγορία ισχύος έχει τέσσερα από αυτά.

  • Μεσαίο αριθμητική τιμή- Αυτός είναι ο πιο κοινός τύπος SV. Είναι ένας μέσος όρος, για τον προσδιορισμό του οποίου ο συνολικός όγκος του εξεταζόμενου χαρακτηριστικού στο σύνολο δεδομένων κατανέμεται εξίσου σε όλες τις μονάδες αυτού του συνόλου.

    Αυτός ο τύπος χωρίζεται σε υποείδη: απλό και σταθμισμένο αριθμητικό SV.

  • Η μέση αρμονική τιμή είναι ένας δείκτης που είναι το αντίστροφο του απλού αριθμητικού μέσου όρου, που υπολογίζεται από τις αντίστροφες τιμές του εν λόγω χαρακτηριστικού.

    Χρησιμοποιείται σε περιπτώσεις όπου οι μεμονωμένες τιμές του χαρακτηριστικού και του προϊόντος είναι γνωστές, αλλά τα δεδομένα συχνότητας όχι.

  • Ο γεωμετρικός μέσος όρος χρησιμοποιείται συχνότερα στην ανάλυση των ρυθμών ανάπτυξης των οικονομικών φαινομένων. Επιτρέπει να διατηρείται αμετάβλητο το γινόμενο των επιμέρους τιμών μιας δεδομένης ποσότητας και όχι το άθροισμα.

    Συμβαίνει επίσης να είναι απλό και ισορροπημένο.

  • Η μέση τετραγωνική τιμή της ρίζας χρησιμοποιείται για τον υπολογισμό μεμονωμένων δεικτών δεικτών, όπως ο συντελεστής διακύμανσης, που χαρακτηρίζει το ρυθμό παραγωγής κ.λπ.

    Επίσης, με τη βοήθειά του υπολογίζονται οι μέσες διαμέτρους σωλήνων, τροχών, οι μέσες πλευρές ενός τετραγώνου και παρόμοια σχήματα.

    Όπως όλοι οι άλλοι τύποι μέσου SW, το μέσο τετράγωνο της ρίζας είναι απλό και σταθμισμένο.

Τύποι δομικών μεγεθών

Εκτός από τους μέσους SW, οι δομικοί τύποι χρησιμοποιούνται συχνά στις στατιστικές. Είναι καλύτερα κατάλληλες για τον υπολογισμό των σχετικών χαρακτηριστικών των τιμών μιας μεταβλητής ιδιότητας και εσωτερική δομήγραμμές διανομής.

Υπάρχουν δύο τέτοιοι τύποι.


Θέμα: Στατιστικά

Επιλογή αριθμός 2

Μέσες τιμές που χρησιμοποιούνται στα στατιστικά στοιχεία

Εισαγωγή………………………………………………………………………………….3

Θεωρητικό έργο

Η μέση τιμή στα στατιστικά στοιχεία, η ουσία και οι συνθήκες εφαρμογής της.

1.1. Η ουσία της μέσης αξίας και οι συνθήκες χρήσης………….4

1.2. Τύποι μέσων τιμών………………………………………………8

Πρακτική εργασία

Εργασία 1,2,3………………………………………………………………………… 14

Συμπέρασμα………………………………………………………………………….21

Κατάλογος χρησιμοποιημένης βιβλιογραφίας……………………………………………………………………………………………………………………

Εισαγωγή

Αυτό δοκιμήαποτελείται από δύο μέρη - θεωρητικό και πρακτικό. Στο θεωρητικό μέρος, μια τόσο σημαντική στατιστική κατηγορία όπως η μέση τιμή θα εξεταστεί λεπτομερώς για να προσδιοριστεί η ουσία και οι συνθήκες εφαρμογής της, καθώς και να προσδιοριστούν τα είδη των μέσων όρων και οι μέθοδοι υπολογισμού τους.

Η στατιστική, όπως γνωρίζετε, μελετά μαζικά κοινωνικοοικονομικά φαινόμενα. Κάθε ένα από αυτά τα φαινόμενα μπορεί να έχει διαφορετική ποσοτική έκφραση του ίδιου χαρακτηριστικού. Για παράδειγμα, οι μισθοί του ίδιου επαγγέλματος των εργαζομένων ή οι τιμές στην αγορά για το ίδιο προϊόν κ.λπ. Οι μέσες τιμές χαρακτηρίζουν δείκτες ποιότητας εμπορικές δραστηριότητες: κόστος διανομής, κέρδος, κερδοφορία κ.λπ.

Για τη μελέτη οποιουδήποτε πληθυσμού σύμφωνα με ποικίλα (ποσοτικά μεταβαλλόμενα) χαρακτηριστικά, η στατιστική χρησιμοποιεί μέσους όρους.

Medium Essence

Η μέση τιμή είναι ένα γενικευτικό ποσοτικό χαρακτηριστικό του συνόλου του ίδιου τύπου φαινομένων σύμφωνα με ένα διαφορετικό χαρακτηριστικό. Στην οικονομική πρακτική, χρησιμοποιείται ένα ευρύ φάσμα δεικτών, που υπολογίζονται ως μέσοι όροι.

Η πιο σημαντική ιδιότητα της μέσης τιμής είναι ότι αντιπροσωπεύει την τιμή ενός συγκεκριμένου χαρακτηριστικού σε ολόκληρο τον πληθυσμό ως ενιαίο αριθμό, παρά τις ποσοτικές διαφορές του σε μεμονωμένες μονάδες του πληθυσμού, και εκφράζει το κοινό πράγμα που είναι εγγενές σε όλες τις μονάδες τον υπό μελέτη πληθυσμό. Έτσι, μέσα από το χαρακτηριστικό μιας μονάδας πληθυσμού, χαρακτηρίζει ολόκληρο τον πληθυσμό ως σύνολο.

Οι μέσες τιμές σχετίζονται με το νόμο μεγάλα νούμερα. Η ουσία αυτής της σχέσης έγκειται στο γεγονός ότι κατά τον μέσο όρο των τυχαίων αποκλίσεων μεμονωμένων τιμών, λόγω της λειτουργίας του νόμου των μεγάλων αριθμών, αλληλοακυρώνονται και στο μέσο όρο αποκαλύπτεται η κύρια αναπτυξιακή τάση, η αναγκαιότητα, η κανονικότητα. Οι μέσες τιμές επιτρέπουν τη σύγκριση δεικτών που σχετίζονται με πληθυσμούς με διαφορετικούς αριθμούς μονάδων.

ΣΤΟ σύγχρονες συνθήκεςη ανάπτυξη των σχέσεων αγοράς στην οικονομία, οι μέσοι όροι χρησιμεύουν ως εργαλείο για τη μελέτη των αντικειμενικών προτύπων των κοινωνικοοικονομικών φαινομένων. Ωστόσο, η οικονομική ανάλυση δεν πρέπει να περιορίζεται μόνο στους μέσους δείκτες, καθώς οι γενικοί ευνοϊκοί μέσοι όροι μπορούν να κρύψουν τόσο σημαντικές όσο και σοβαρές ελλείψεις στις δραστηριότητες μεμονωμένων οικονομικών οντοτήτων, όσο και τα φύτρα μιας νέας, προοδευτικής. Για παράδειγμα, η κατανομή του πληθυσμού ανά εισόδημα καθιστά δυνατό τον εντοπισμό του σχηματισμού νέων Κοινωνικές Ομάδες. Ως εκ τούτου, μαζί με τα μέσα στατιστικά δεδομένα, είναι απαραίτητο να ληφθούν υπόψη τα χαρακτηριστικά των επιμέρους μονάδων του πληθυσμού.

Η μέση τιμή είναι το αποτέλεσμα όλων των παραγόντων που επηρεάζουν το υπό μελέτη φαινόμενο. Δηλαδή, κατά τον υπολογισμό των μέσων τιμών, η επίδραση τυχαίων (διαταραχών, μεμονωμένων) παραγόντων αλληλοεξουδετερώνεται και, επομένως, είναι δυνατό να προσδιοριστεί το μοτίβο που είναι εγγενές στο υπό μελέτη φαινόμενο. Ο Adolf Quetelet τόνισε ότι η σημασία της μεθόδου των μέσων όρων έγκειται στη δυνατότητα μετάβασης από τον ενικό στο γενικό, από το τυχαίο στο κανονικό, και η ύπαρξη μέσων όρων είναι μια κατηγορία αντικειμενικής πραγματικότητας.

Η στατιστική μελετά μαζικά φαινόμενα και διαδικασίες. Κάθε ένα από αυτά τα φαινόμενα έχει τόσο κοινές για ολόκληρο το σύνολο όσο και ειδικές, μεμονωμένες ιδιότητες. Η διαφορά μεταξύ μεμονωμένων φαινομένων ονομάζεται παραλλαγή. Μια άλλη ιδιότητα των μαζικών φαινομένων είναι η εγγενής εγγύτητα των χαρακτηριστικών των επιμέρους φαινομένων. Άρα, η αλληλεπίδραση των στοιχείων του συνόλου οδηγεί στον περιορισμό της διακύμανσης τουλάχιστον μέρους των ιδιοτήτων τους. Αυτή η τάση υπάρχει αντικειμενικά. Είναι στην αντικειμενικότητά του ότι ο λόγος για την ευρύτερη εφαρμογή των μέσων τιμών στην πράξη και στη θεωρία βρίσκεται.

Η μέση τιμή στα στατιστικά είναι ένας γενικευμένος δείκτης που χαρακτηρίζει το τυπικό επίπεδο ενός φαινομένου σε συγκεκριμένες συνθήκες τόπου και χρόνου, αντικατοπτρίζοντας το μέγεθος μιας μεταβλητής ιδιότητας ανά μονάδα ενός ποιοτικά ομοιογενούς πληθυσμού.

Στην οικονομική πρακτική, χρησιμοποιείται ένα ευρύ φάσμα δεικτών, που υπολογίζονται ως μέσοι όροι.

Με τη βοήθεια της μεθόδου των μέσων όρων, η στατιστική λύνει πολλά προβλήματα.

Η κύρια τιμή των μέσων όρων είναι η γενικευτική τους λειτουργία, δηλαδή η αντικατάσταση πολλών διαφορετικών μεμονωμένων τιμών ενός χαρακτηριστικού από μια μέση τιμή που χαρακτηρίζει ολόκληρο το σύνολο των φαινομένων.

Εάν η μέση τιμή γενικεύει ποιοτικά ομοιογενείς τιμές ενός χαρακτηριστικού, τότε είναι τυπικό χαρακτηριστικό ενός χαρακτηριστικού σε έναν δεδομένο πληθυσμό.

Ωστόσο, είναι λάθος να μειώνουμε τον ρόλο των μέσων τιμών μόνο στον χαρακτηρισμό των τυπικών τιμών χαρακτηριστικών σε πληθυσμούς που είναι ομοιογενείς ως προς αυτό το χαρακτηριστικό. Στην πράξη, πολύ πιο συχνά οι σύγχρονες στατιστικές χρησιμοποιούν μέσους όρους που γενικεύουν σαφώς ομοιογενή φαινόμενα.

Η μέση αξία του κατά κεφαλήν εθνικού εισοδήματος, η μέση απόδοση των σιτηρών σε όλη τη χώρα, η μέση κατανάλωση διαφόρων τροφίμων είναι τα χαρακτηριστικά του κράτους ως ενιαίου οικονομικού συστήματος, αυτοί είναι οι λεγόμενοι μέσοι όροι του συστήματος.

Οι μέσοι όροι συστημάτων μπορούν να χαρακτηρίσουν τόσο χωρικά ή αντικειμενικά συστήματα που υπάρχουν ταυτόχρονα (πολιτεία, βιομηχανία, περιοχή, πλανήτης Γη, κ.λπ.) όσο και δυναμικά συστήματα που εκτείνονται με την πάροδο του χρόνου (έτος, δεκαετία, εποχή κ.λπ.).

Η πιο σημαντική ιδιότητα της μέσης τιμής είναι ότι αντικατοπτρίζει το κοινό που είναι εγγενές σε όλες τις μονάδες του υπό μελέτη πληθυσμού. Οι τιμές του χαρακτηριστικού των μεμονωμένων μονάδων του πληθυσμού κυμαίνονται προς τη μία ή την άλλη κατεύθυνση υπό την επίδραση πολλών παραγόντων, μεταξύ των οποίων μπορεί να υπάρχουν τόσο βασικοί όσο και τυχαίοι. Για παράδειγμα, η τιμή της μετοχής μιας εταιρείας στο σύνολό της καθορίζεται από αυτήν οικονομική θέση. Ταυτόχρονα, ορισμένες ημέρες και σε ορισμένα χρηματιστήρια, λόγω των συνθηκών που επικρατούν, οι μετοχές αυτές ενδέχεται να πωλούνται με υψηλότερη ή χαμηλότερη τιμή. Η ουσία του μέσου όρου έγκειται στο γεγονός ότι ακυρώνει τις αποκλίσεις των τιμών των χαρακτηριστικών μεμονωμένων μονάδων του πληθυσμού, λόγω της δράσης τυχαίων παραγόντων, και λαμβάνει υπόψη τις αλλαγές που προκαλούνται από τη δράση του κύριοι παράγοντες. Αυτό επιτρέπει στον μέσο όρο να αντικατοπτρίζει το τυπικό επίπεδο του χαρακτηριστικού και να αφαιρεί από τα επιμέρους χαρακτηριστικά που είναι εγγενή σε μεμονωμένες μονάδες.

Ο υπολογισμός του μέσου όρου είναι μια κοινή τεχνική γενίκευσης. ο μέσος δείκτης αντικατοπτρίζει το γενικό που είναι τυπικό (τυπικό) για όλες τις μονάδες του υπό μελέτη πληθυσμού, ενώ ταυτόχρονα αγνοεί τις διαφορές μεταξύ των επιμέρους μονάδων. Σε κάθε φαινόμενο και την εξέλιξή του υπάρχει ένας συνδυασμός τύχης και αναγκαιότητας.

Ο μέσος όρος είναι ένα συνοπτικό χαρακτηριστικό των κανονικοτήτων της διαδικασίας στις συνθήκες υπό τις οποίες προχωρά.

Κάθε μέσος όρος χαρακτηρίζει τον υπό μελέτη πληθυσμό σύμφωνα με οποιοδήποτε χαρακτηριστικό, αλλά για να χαρακτηριστεί οποιοσδήποτε πληθυσμός, να περιγραφούν τα τυπικά χαρακτηριστικά και τα ποιοτικά χαρακτηριστικά του, απαιτείται ένα σύστημα μέσων δεικτών. Ως εκ τούτου, στην πρακτική των εγχώριων στατιστικών για τη μελέτη κοινωνικο-οικονομικών φαινομένων, κατά κανόνα, υπολογίζεται ένα σύστημα μέσων δεικτών. Έτσι, για παράδειγμα, ο μέσος όρος μισθοίαξιολογούνται μαζί με δείκτες μέσης παραγωγής, αναλογίας κεφαλαίου-εργασίας και αναλογίας ισχύος προς εργασία, ο βαθμός μηχανοποίησης και αυτοματοποίησης της εργασίας κ.λπ.

Ο μέσος όρος θα πρέπει να υπολογίζεται λαμβάνοντας υπόψη το οικονομικό περιεχόμενο του υπό μελέτη δείκτη. Επομένως, για έναν συγκεκριμένο δείκτη που χρησιμοποιείται στην κοινωνικοοικονομική ανάλυση, μόνο μία πραγματική τιμή του μέσου όρου μπορεί να υπολογιστεί με βάση την επιστημονική μέθοδο υπολογισμού.

Η μέση τιμή είναι ένας από τους σημαντικότερους γενικευτικούς στατιστικούς δείκτες που χαρακτηρίζει το σύνολο του ίδιου τύπου φαινομένων σύμφωνα με κάποιο ποσοτικά μεταβαλλόμενο χαρακτηριστικό. Οι μέσοι όροι στα στατιστικά είναι γενικευτικοί δείκτες, αριθμοί που εκφράζουν τις τυπικές χαρακτηριστικές διαστάσεις των κοινωνικών φαινομένων σύμφωνα με ένα ποσοτικά μεταβαλλόμενο χαρακτηριστικό.

Τύποι μέσων όρων

Οι τύποι των μέσων τιμών διαφέρουν κυρίως ως προς το ποια ιδιότητα, ποια παράμετρος της αρχικής μεταβλητής μάζας των μεμονωμένων τιμών του χαρακτηριστικού πρέπει να διατηρείται αμετάβλητη.

Αριθμητικός μέσος όρος

Ο αριθμητικός μέσος όρος είναι μια τέτοια μέση τιμή ενός χαρακτηριστικού, στον υπολογισμό του οποίου ο συνολικός όγκος του χαρακτηριστικού στο σύνολο παραμένει αμετάβλητος. Διαφορετικά, μπορούμε να πούμε ότι ο αριθμητικός μέσος όρος είναι η μέση άθροιση. Όταν υπολογίζεται, ο συνολικός όγκος του χαρακτηριστικού κατανέμεται νοερά εξίσου σε όλες τις μονάδες του πληθυσμού.

Ο αριθμητικός μέσος όρος χρησιμοποιείται εάν είναι γνωστές οι τιμές του μέσου όρου του χαρακτηριστικού (x) και του αριθμού των μονάδων πληθυσμού με μια συγκεκριμένη τιμή χαρακτηριστικού (f).

Ο αριθμητικός μέσος όρος μπορεί να είναι απλός και σταθμισμένος.

απλός αριθμητικός μέσος όρος

Ένα απλό χρησιμοποιείται εάν κάθε τιμή χαρακτηριστικού x εμφανίζεται μία φορά, π.χ. για κάθε x, η τιμή χαρακτηριστικού είναι f=1 ή εάν τα αρχικά δεδομένα δεν είναι ταξινομημένα και δεν είναι γνωστό πόσες μονάδες έχουν συγκεκριμένες τιμές χαρακτηριστικών.

Ο τύπος για τον αριθμητικό μέσο όρο είναι απλός.

,

5.1. Η έννοια του μέσου όρου

Μέση αξία -αυτός είναι ένας γενικευμένος δείκτης που χαρακτηρίζει το τυπικό επίπεδο του φαινομένου. Εκφράζει την τιμή του χαρακτηριστικού, που σχετίζεται με τη μονάδα του πληθυσμού.

Ο μέσος όρος γενικεύει πάντα την ποσοτική διακύμανση του χαρακτηριστικού, δηλ. στις μέσες τιμές, οι επιμέρους διαφορές στις μονάδες του πληθυσμού λόγω τυχαίων περιστάσεων ακυρώνονται. Σε αντίθεση με τον μέσο όρο, η απόλυτη τιμή που χαρακτηρίζει το επίπεδο ενός χαρακτηριστικού μιας μεμονωμένης μονάδας του πληθυσμού δεν επιτρέπει τη σύγκριση των τιμών του χαρακτηριστικού για μονάδες που ανήκουν σε διαφορετικούς πληθυσμούς. Επομένως, εάν πρέπει να συγκρίνετε τα επίπεδα αμοιβής των εργαζομένων σε δύο επιχειρήσεις, τότε δεν μπορείτε να συγκρίνετε δύο υπαλλήλους διαφορετικών επιχειρήσεων σε αυτή τη βάση. Οι μισθοί των εργαζομένων που επιλέχθηκαν για σύγκριση μπορεί να μην είναι τυπικοί για αυτές τις επιχειρήσεις. Εάν συγκρίνουμε το μέγεθος των αμοιβαίων κεφαλαίων στις υπό εξέταση επιχειρήσεις, τότε ο αριθμός των εργαζομένων δεν λαμβάνεται υπόψη και, επομένως, είναι αδύνατο να προσδιοριστεί πού είναι υψηλότερο το επίπεδο των μισθών. Τελικά, μόνο οι μέσοι όροι μπορούν να συγκριθούν, δηλ. Πόσο κερδίζει ένας εργαζόμενος κατά μέσο όρο σε κάθε εταιρεία; Επομένως, υπάρχει ανάγκη να υπολογιστεί η μέση τιμή ως γενικευτικό χαρακτηριστικό του πληθυσμού.

Ο υπολογισμός του μέσου όρου είναι μια κοινή τεχνική γενίκευσης. ο μέσος δείκτης αρνείται το γενικό που είναι τυπικό (τυπικό) για όλες τις μονάδες του υπό μελέτη πληθυσμού, ενώ ταυτόχρονα αγνοεί τις διαφορές μεταξύ των επιμέρους μονάδων. Σε κάθε φαινόμενο και την εξέλιξή του υπάρχει ένας συνδυασμός τύχης και αναγκαιότητας. Κατά τον υπολογισμό των μέσων όρων, λόγω της λειτουργίας του νόμου των μεγάλων αριθμών, η τυχαιότητα αλληλοεξουδετερώνεται, εξισορροπείται, ώστε να μπορείτε να αφαιρέσετε από τα ασήμαντα χαρακτηριστικά του φαινομένου, από τις ποσοτικές τιμές του χαρακτηριστικού σε κάθε συγκεκριμένη περίπτωση. Στην ικανότητα αφαίρεσης από την τυχαιότητα των επιμέρους τιμών, τις διακυμάνσεις, έγκειται η επιστημονική αξία των μέσων όρων ως γενικευτικών χαρακτηριστικών των αδρανών.

Προκειμένου ο μέσος όρος να είναι πραγματικά χαρακτηριστικός, πρέπει να υπολογιστεί λαμβάνοντας υπόψη ορισμένες αρχές.

Ας σταθούμε σε μερικά γενικές αρχέςτη χρήση των μέσων όρων.
1. Ο μέσος όρος πρέπει να προσδιορίζεται για πληθυσμούς που αποτελούνται από ποιοτικά ομοιογενείς μονάδες.
2. Ο μέσος όρος πρέπει να υπολογίζεται για έναν πληθυσμό που αποτελείται από έναν αρκετά μεγάλο αριθμό μονάδων.
3. Ο μέσος όρος πρέπει να υπολογίζεται για τον πληθυσμό, οι μονάδες του οποίου βρίσκονται σε κανονική, φυσική κατάσταση.
4. Ο μέσος όρος πρέπει να υπολογίζεται λαμβάνοντας υπόψη το οικονομικό περιεχόμενο του υπό μελέτη δείκτη.

5.2. Τύποι μέσων όρων και μέθοδοι υπολογισμού τους

Ας εξετάσουμε τώρα τους τύπους των μέσων όρων, τα χαρακτηριστικά του υπολογισμού τους και τους τομείς εφαρμογής. Οι μέσες τιμές χωρίζονται σε δύο μεγάλες κατηγορίες: μέσους όρους ισχύος, δομικούς μέσους όρους.

Προς την δύναμη σημαίνειπεριλαμβάνουν τους πιο διάσημους και ευρέως χρησιμοποιούμενους τύπους όπως ο γεωμετρικός μέσος όρος, ο αριθμητικός μέσος όρος και ο μέσος όρος του τετραγώνου.

Οπως και διαρθρωτικούς μέσους όρουςλαμβάνεται υπόψη ο τρόπος και η διάμεσος.

Ας σταθούμε στους μέσους όρους ισχύος. Οι μέσοι όροι ισχύος, ανάλογα με την παρουσίαση των αρχικών δεδομένων, μπορεί να είναι απλοί και σταθμισμένοι. απλός μέσος όροςυπολογίζεται από μη ομαδοποιημένα δεδομένα και έχει την ακόλουθη γενική μορφή:

όπου X i είναι η παραλλαγή (τιμή) του μέσου όρου χαρακτηριστικού.

n είναι ο αριθμός των επιλογών.

Σταθμισμένος μέσος όροςυπολογίζεται με ομαδοποιημένα δεδομένα και έχει γενική μορφή

,

όπου X i είναι η παραλλαγή (τιμή) του μέσου όρου του χαρακτηριστικού ή η μεσαία τιμή του διαστήματος στο οποίο μετράται η παραλλαγή·
m είναι ο εκθέτης του μέσου όρου.
f i - συχνότητα που δείχνει πόσες φορές εμφανίζεται η τιμή i-e του μέσου όρου του χαρακτηριστικού.

Ας δώσουμε ως παράδειγμα τον υπολογισμό του μέσου όρου ηλικίας των μαθητών σε μια ομάδα 20 ατόμων:


Υπολογίζουμε τη μέση ηλικία χρησιμοποιώντας τον απλό μέσο όρο:

Ας ομαδοποιήσουμε τα δεδομένα πηγής. Λαμβάνουμε την ακόλουθη σειρά διανομής:

Ως αποτέλεσμα της ομαδοποίησης, παίρνουμε έναν νέο δείκτη - συχνότητα, που υποδεικνύει τον αριθμό των μαθητών ηλικίας X ετών. Συνεπώς, ΜΕΣΟΣ ΟΡΟΣ ΗΛΙΚΙΑΣΗ ομάδα μαθητών θα υπολογιστεί χρησιμοποιώντας τον σταθμισμένο μέσο όρο:

Οι γενικοί τύποι για τον υπολογισμό των εκθετικών μέσων όρων έχουν εκθέτη (m). Ανάλογα με την τιμή που παίρνει, διακρίνονται οι ακόλουθοι τύποι μέσου όρου ισχύος:
αρμονική μέση αν m = -1;
γεωμετρικός μέσος όρος εάν m –> 0;
αριθμητικός μέσος όρος εάν m = 1;
ρίζα μέσο τετράγωνο αν m = 2;
μέση κυβική αν m = 3.

Οι τύποι μέσης ισχύος δίνονται στον Πίνακα. 4.4.

Εάν υπολογίσουμε όλους τους τύπους μέσων όρων για τα ίδια αρχικά δεδομένα, τότε οι τιμές τους δεν θα είναι ίδιες. Εδώ ισχύει ο κανόνας της μείζονος σημασίας των μέσων όρων: με την αύξηση του εκθέτη m, η αντίστοιχη μέση τιμή αυξάνεται επίσης:

Στη στατιστική πρακτική, συχνότερα από άλλους τύπους σταθμισμένων μέσων όρων, χρησιμοποιούνται αριθμητικοί και αρμονικοί σταθμισμένοι μέσοι όροι.

Πίνακας 5.1

Τύποι μέσων ισχύος

Τύπος ισχύος
Μέσης
Δείκτης
μοίρες (m)
Τύπος υπολογισμού
Απλός σταθμισμένη
αρμονικός -1
Γεωμετρικός 0
Αριθμητική 1
τετραγωνικός 2
κυβικός 3

Ο αρμονικός μέσος όρος έχει πιο σύνθετη δομή από τον αριθμητικό μέσο όρο. Ο αρμονικός μέσος όρος χρησιμοποιείται για υπολογισμούς όταν τα βάρη δεν είναι οι μονάδες του πληθυσμού - οι φορείς του χαρακτηριστικού, αλλά τα γινόμενα αυτών των μονάδων και οι τιμές του χαρακτηριστικού (δηλαδή m = Xf). Ο μέσος χρόνος αρμονικής διακοπής θα πρέπει να χρησιμοποιείται σε περιπτώσεις προσδιορισμού, για παράδειγμα, του μέσου κόστους εργασίας, χρόνου, υλικών ανά μονάδα παραγωγής, ανά μέρος για δύο (τρεις, τέσσερις κ.λπ.) επιχειρήσεις, εργαζομένους που ασχολούνται με την κατασκευή του ίδιο είδος προϊόντος, ίδιο μέρος, προϊόν.

Η κύρια απαίτηση για τον τύπο για τον υπολογισμό της μέσης τιμής είναι όλα τα στάδια του υπολογισμού να έχουν μια πραγματική ουσιαστική αιτιολόγηση. η προκύπτουσα μέση τιμή θα πρέπει να αντικαταστήσει τις μεμονωμένες τιμές του χαρακτηριστικού για κάθε αντικείμενο χωρίς να σπάσει τη σύνδεση μεταξύ μεμονωμένων και συνοπτικών δεικτών. Με άλλα λόγια, η μέση τιμή θα πρέπει να υπολογίζεται έτσι ώστε όταν κάθε μεμονωμένη τιμή του μέσου όρου του δείκτη αντικαθίσταται από τη μέση τιμή του, κάποιος τελικός συνοπτικός δείκτης παραμένει αμετάβλητος, σχετίζεται μεή με άλλο τρόπο με μέσο όρο . Αυτό το αποτέλεσμα ονομάζεται καθοριστικόαφού η φύση της σχέσης του με μεμονωμένες τιμές καθορίζει τον συγκεκριμένο τύπο για τον υπολογισμό της μέσης τιμής. Ας δείξουμε αυτόν τον κανόνα στο παράδειγμα του γεωμετρικού μέσου όρου.

Γεωμετρικός μέσος τύπος

χρησιμοποιείται συχνότερα κατά τον υπολογισμό της μέσης τιμής των επιμέρους σχετικών τιμών της δυναμικής.

Ο γεωμετρικός μέσος όρος χρησιμοποιείται εάν δοθεί μια ακολουθία αλυσίδων σχετικών τιμών της δυναμικής, που υποδεικνύει, για παράδειγμα, αύξηση της παραγωγής σε σύγκριση με το επίπεδο του προηγούμενου έτους: i 1 , i 2 , i 3 ,... , σε . Είναι σαφές ότι ο όγκος της παραγωγής πέρυσικαθορίζεται από το αρχικό του επίπεδο (q 0) και την επακόλουθη ανάπτυξη με την πάροδο των ετών:

q n =q 0 × i 1 × i 2 ×...×i n .

Λαμβάνοντας το q n ως καθοριστικό δείκτη και αντικαθιστώντας τις επιμέρους τιμές των δεικτών δυναμικής με μέσες, φτάνουμε στη σχέση

Από εδώ

5.3. Διαρθρωτικοί μέσοι όροι

Ένας ειδικός τύπος μέσων τιμών - δομικοί μέσοι όροι - χρησιμοποιείται για τη μελέτη της εσωτερικής δομής της σειράς κατανομής τιμών χαρακτηριστικών, καθώς και για την εκτίμηση της μέσης τιμής (τύπος ισχύος), εάν, σύμφωνα με τα διαθέσιμα στατιστικά δεδομένα, ο υπολογισμός του δεν μπορεί να πραγματοποιηθεί (για παράδειγμα, αν δεν υπήρχαν δεδομένα στο εξεταζόμενο παράδειγμα) και για τον όγκο της παραγωγής και για το ποσό του κόστους ανά ομάδες επιχειρήσεων).

Οι δείκτες χρησιμοποιούνται συχνότερα ως δομικοί μέσοι όροι. μόδα -η πιο συχνά επαναλαμβανόμενη τιμή χαρακτηριστικού - και διάμεσος -την τιμή ενός χαρακτηριστικού που διαιρεί τη διατεταγμένη ακολουθία των τιμών του σε δύο μέρη ίσα σε αριθμό. Ως αποτέλεσμα, στο ένα ήμισυ των μονάδων πληθυσμού, η τιμή του χαρακτηριστικού δεν υπερβαίνει το διάμεσο επίπεδο και στο άλλο μισό δεν είναι μικρότερη από αυτό.

Εάν το υπό μελέτη χαρακτηριστικό έχει διακριτές τιμές, τότε δεν υπάρχουν ιδιαίτερες δυσκολίες στον υπολογισμό του τρόπου λειτουργίας και της διάμεσης τιμής. Εάν τα δεδομένα σχετικά με τις τιμές του χαρακτηριστικού X παρουσιάζονται με τη μορφή διατεταγμένων διαστημάτων της αλλαγής του (σειρές διαστημάτων), ο υπολογισμός του τρόπου λειτουργίας και της διάμεσης τιμής γίνεται κάπως πιο περίπλοκος. Εφόσον η διάμεση τιμή διαιρεί ολόκληρο τον πληθυσμό σε δύο μέρη ίσα σε αριθμό, καταλήγει σε ένα από τα διαστήματα του χαρακτηριστικού X. Χρησιμοποιώντας την παρεμβολή, η διάμεση τιμή βρίσκεται σε αυτό το διάμεσο διάστημα:

,

όπου X Me είναι το κατώτερο όριο του διάμεσου διαστήματος.
h Εγώ είναι η αξία του.
(Άθροισμα m) / 2 - το ήμισυ του συνολικού αριθμού παρατηρήσεων ή το ήμισυ του όγκου του δείκτη που χρησιμοποιείται ως στάθμιση στους τύπους για τον υπολογισμό της μέσης τιμής (σε απόλυτες ή σχετικές τιμές).
S Me-1 είναι το άθροισμα των παρατηρήσεων (ή ο όγκος του χαρακτηριστικού στάθμισης) που έχει συσσωρευτεί πριν από την έναρξη του διάμεσου διαστήματος.
m Me είναι ο αριθμός των παρατηρήσεων ή ο όγκος του χαρακτηριστικού στάθμισης στο διάμεσο διάστημα (επίσης σε απόλυτους ή σχετικούς όρους).

Στο παράδειγμά μας, μπορούν να ληφθούν ακόμη και τρεις διάμεσες τιμές - με βάση τα σημάδια του αριθμού των επιχειρήσεων, του όγκου της παραγωγής και του συνολικού κόστους παραγωγής:

Έτσι, για τις μισές επιχειρήσεις, το κόστος μιας μονάδας παραγωγής υπερβαίνει τα 125,19 χιλιάδες ρούβλια, το ήμισυ του συνολικού όγκου παραγωγής παράγεται με επίπεδο κόστους ανά προϊόν μεγαλύτερο από 124,79 χιλιάδες ρούβλια. και το 50% του συνολικού κόστους διαμορφώνεται στο επίπεδο του κόστους ενός προϊόντος πάνω από 125,07 χιλιάδες ρούβλια. Σημειώνουμε επίσης ότι υπάρχει μια ορισμένη ανοδική τάση στο κόστος, καθώς Me 2 = 124,79 χιλιάδες ρούβλια, και μέσο επίπεδοίσο με 123,15 χιλιάδες ρούβλια.

Κατά τον υπολογισμό της τροπικής τιμής ενός χαρακτηριστικού σύμφωνα με τα δεδομένα της σειράς διαστημάτων, είναι απαραίτητο να προσέξετε το γεγονός ότι τα διαστήματα είναι τα ίδια, καθώς ο δείκτης της συχνότητας των τιμών χαρακτηριστικών X εξαρτάται από αυτό. μια σειρά διαστημάτων με ίσα διαστήματα, η τιμή του τρόπου λειτουργίας καθορίζεται ως

όπου X Mo είναι η χαμηλότερη τιμή του διαστήματος των τρόπων.
m Mo είναι ο αριθμός των παρατηρήσεων ή ο όγκος του χαρακτηριστικού στάθμισης στο τροπικό διάστημα (σε απόλυτους ή σχετικούς όρους).
m Mo -1 - το ίδιο για το διάστημα που προηγείται του modal.
m Mo+1 - το ίδιο για το διάστημα που ακολουθεί το modal.
h είναι η τιμή του διαστήματος μεταβολής του χαρακτηριστικού σε ομάδες.

Για το παράδειγμά μας, τρεις τιμές μεταφορών μπορούν να υπολογιστούν με βάση τα σημάδια του αριθμού των επιχειρήσεων, του όγκου της παραγωγής και του ύψους του κόστους. Και στις τρεις περιπτώσεις, το χρονικό διάστημα είναι το ίδιο, καθώς για το ίδιο διάστημα τόσο ο αριθμός των επιχειρήσεων, ο όγκος παραγωγής όσο και το συνολικό ποσό του κόστους παραγωγής αποδεικνύονται τα μεγαλύτερα:

Έτσι, οι επιχειρήσεις με επίπεδο κόστους 126,75 χιλιάδες ρούβλια συναντώνται συχνότερα, προϊόντα με επίπεδο κόστους 126,69 χιλιάδες ρούβλια παράγονται συχνότερα και συνήθως το κόστος παραγωγής εξηγείται από ένα επίπεδο κόστους 123,73 χιλιάδες ρούβλια.

5.4. Δείκτες διακύμανσης

Οι συγκεκριμένες συνθήκες στις οποίες βρίσκεται καθένα από τα αντικείμενα που μελετήθηκαν, καθώς και τα χαρακτηριστικά της δικής τους ανάπτυξης (κοινωνική, οικονομική κ.λπ.) εκφράζονται με τα αντίστοιχα αριθμητικά επίπεδα στατιστικών δεικτών. Με αυτόν τον τρόπο, παραλλαγή,εκείνοι. η ασυμφωνία μεταξύ των επιπέδων του ίδιου δείκτη σε διαφορετικά αντικείμενα είναι αντικειμενική και βοηθά στην κατανόηση της ουσίας του υπό μελέτη φαινομένου.

Υπάρχουν διάφοροι τρόποι μέτρησης της διακύμανσης στα στατιστικά στοιχεία.

Ο πιο απλός είναι ο υπολογισμός του δείκτη παραλλαγή εύρους H ως η διαφορά μεταξύ των μέγιστων (X max) και ελάχιστων (X min) παρατηρούμενων τιμών του χαρακτηριστικού:

H=X max - X min .

Ωστόσο, το εύρος διακύμανσης δείχνει μόνο τις ακραίες τιμές του χαρακτηριστικού. Η επαναληψιμότητα των ενδιάμεσων τιμών δεν λαμβάνεται υπόψη εδώ.

Τα πιο αυστηρά χαρακτηριστικά είναι δείκτες διακύμανσης σε σχέση με το μέσο επίπεδο του χαρακτηριστικού. Ο απλούστερος δείκτης αυτού του τύπου είναι μέση τιμή γραμμική απόκλιση L ως αριθμητικός μέσος όρος των απόλυτων αποκλίσεων ενός χαρακτηριστικού από το μέσο επίπεδό του:

Με την επανάληψη των επιμέρους τιμών του X, χρησιμοποιείται ο σταθμισμένος αριθμητικός μέσος τύπος:

(Θυμηθείτε ότι το αλγεβρικό άθροισμα των αποκλίσεων από το μέσο επίπεδο είναι μηδέν.)

Ο δείκτης της μέσης γραμμικής απόκλισης έχει βρει ευρεία εφαρμογή στην πράξη. Με τη βοήθειά του, για παράδειγμα, αναλύεται η σύνθεση των εργαζομένων, ο ρυθμός παραγωγής, η ομοιομορφία της προσφοράς υλικών και αναπτύσσονται συστήματα υλικών κινήτρων. Αλλά, δυστυχώς, αυτός ο δείκτης περιπλέκει τους υπολογισμούς ενός πιθανολογικού τύπου, καθιστά δύσκολη την εφαρμογή των μεθόδων μαθηματικών στατιστικών. Επομένως, στη στατιστική επιστημονική έρευνα, ο δείκτης χρησιμοποιείται συχνότερα για τη μέτρηση της διακύμανσης. διασπορά.

Η διακύμανση χαρακτηριστικών (s 2) προσδιορίζεται με βάση τη μέση τετραγωνική ισχύ:

.

Ένας εκθέτης s ίσος με ονομάζεται τυπική απόκλιση.

Στη γενική θεωρία της στατιστικής, ο δείκτης διασποράς είναι μια εκτίμηση του ομώνυμου δείκτη της θεωρίας πιθανοτήτων και (ως το άθροισμα των τετραγωνικών αποκλίσεων) μια εκτίμηση της διασποράς στη μαθηματική στατιστική, η οποία επιτρέπει τη χρήση των διατάξεων αυτών των θεωρητικών κλάδων για αναλύουν τις κοινωνικοοικονομικές διαδικασίες.

Εάν η διακύμανση εκτιμάται από έναν μικρό αριθμό παρατηρήσεων που λαμβάνονται από έναν απεριόριστο γενικό πληθυσμό, τότε η μέση τιμή του χαρακτηριστικού προσδιορίζεται με κάποιο σφάλμα. Η υπολογισμένη τιμή της διασποράς φαίνεται να μετατοπίζεται προς τα κάτω. Για να ληφθεί μια αμερόληπτη εκτίμηση, η διακύμανση του δείγματος που λαμβάνεται από τους παραπάνω τύπους πρέπει να πολλαπλασιαστεί επί n / (n - 1). Ως αποτέλεσμα, με έναν μικρό αριθμό παρατηρήσεων (< 30) дисперсию признака рекомендуется вычислять по формуле

Συνήθως ήδη στο n > (15÷20) η απόκλιση μεταξύ των μεροληπτικών και των αμερόληπτων εκτιμήσεων γίνεται ασήμαντη. Για τον ίδιο λόγο, η προκατάληψη συνήθως δεν λαμβάνεται υπόψη στον τύπο για την προσθήκη διακυμάνσεων.

Εάν ληφθούν πολλά δείγματα από τον γενικό πληθυσμό και κάθε φορά προσδιορίζεται η μέση τιμή του χαρακτηριστικού, τότε προκύπτει το πρόβλημα της εκτίμησης της μεταβλητότητας των μέσων όρων. Εκτίμηση διακύμανσης μέση τιμήμπορεί επίσης να βασίζεται σε ένα μόνο δείγμα παρατήρησης σύμφωνα με τον τύπο

,

όπου n είναι το μέγεθος του δείγματος. s 2 είναι η διακύμανση του χαρακτηριστικού που υπολογίζεται από τα δείγματα δεδομένων.

αξία λέγεται μέσο δειγματοληπτικό σφάλμακαι είναι χαρακτηριστικό της απόκλισης της μέσης τιμής του δείγματος του χαρακτηριστικού X από την πραγματική μέση τιμή του. Ο δείκτης μέσου σφάλματος χρησιμοποιείται για την αξιολόγηση της αξιοπιστίας των αποτελεσμάτων της παρατήρησης του δείγματος.

Σχετικοί δείκτες διασποράς.Για να χαρακτηριστεί το μέτρο της διακύμανσης του υπό μελέτη χαρακτηριστικού, οι δείκτες διακύμανσης υπολογίζονται σε σχετικούς όρους. Επιτρέπουν σε κάποιον να συγκρίνει τη φύση της διασποράς σε διαφορετικές κατανομές ( διάφορες μονάδεςπαρατηρήσεις του ίδιου χαρακτηριστικού σε δύο σύνολα, με διαφορετικές μέσες τιμές, κατά τη σύγκριση διαφορετικών συνόλων). Ο υπολογισμός των δεικτών μέτρησης της σχετικής διασποράς πραγματοποιείται ως ο λόγος του απόλυτου δείκτη διασποράς προς τον αριθμητικό μέσο όρο, πολλαπλασιαζόμενος επί 100%.

1. Συντελεστής ταλάντωσηςαντανακλά τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο

.

2. Η σχετική γραμμική διακοπή λειτουργίας χαρακτηρίζει το μερίδιο της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή

.

3. Συντελεστής διακύμανσης:

είναι το πιο κοινό μέτρο διακύμανσης που χρησιμοποιείται για την αξιολόγηση της τυπικότητας των μέσων όρων.

Στις στατιστικές, πληθυσμοί με συντελεστή διακύμανσης μεγαλύτερο από 30-35% θεωρούνται ετερογενείς.

Αυτή η μέθοδος εκτίμησης της διακύμανσης έχει επίσης ένα σημαντικό μειονέκτημα. Πράγματι, έστω, για παράδειγμα, ο αρχικός πληθυσμός των εργαζομένων με μέση προϋπηρεσία 15 ετών, με τυπική απόκλιση s = 10 έτη, «γερασμένος» κατά άλλα 15 χρόνια. Τώρα = 30 χρόνια, και κατά μέσο όρο τυπική απόκλισηεξακολουθεί να ισούται με 10. Ο προηγουμένως ετερογενής πληθυσμός (10/15 × 100 = 66,7%), επομένως αποδεικνύεται αρκετά ομοιογενής με την πάροδο του χρόνου (10/30 × 100 = 33,3%).

Boyarsky A.Ya. Θεωρητική έρευνα για τη στατιστική: Σάββ. Επιστημονικός Πρακτικά - Μ.: Στατιστική, 1974. σελ. 19–57.

Προηγούμενος

Οι μέσες τιμές αναφέρονται σε γενίκευση στατιστικών δεικτών που δίνουν ένα συνοπτικό (τελικό) χαρακτηριστικό των μαζικών κοινωνικών φαινομένων, αφού δομούνται με βάση ένας μεγάλος αριθμόςμεμονωμένες τιμές ενός μεταβλητού χαρακτηριστικού. Για να διευκρινιστεί η ουσία της μέσης τιμής, είναι απαραίτητο να εξεταστούν τα χαρακτηριστικά του σχηματισμού των τιμών των σημείων αυτών των φαινομένων, σύμφωνα με τα οποία υπολογίζεται η μέση τιμή.

Είναι γνωστό ότι οι μονάδες κάθε μαζικού φαινομένου έχουν πολυάριθμα χαρακτηριστικά. Όποιο από αυτά τα σημάδια πάρουμε, οι τιμές του για μεμονωμένες μονάδες θα είναι διαφορετικές, αλλάζουν ή, όπως λένε στα στατιστικά στοιχεία, διαφέρουν από τη μια μονάδα στην άλλη. Έτσι, για παράδειγμα, ο μισθός ενός εργαζομένου καθορίζεται από τα προσόντα του, τη φύση της εργασίας, τη διάρκεια της υπηρεσίας και έναν αριθμό άλλων παραγόντων, και ως εκ τούτου ποικίλλει σε πολύ μεγάλο εύρος. Η σωρευτική επιρροή όλων των παραγόντων καθορίζει το ύψος των αποδοχών κάθε εργαζόμενου, ωστόσο, μπορούμε να μιλήσουμε για τους μέσους μηνιαίους μισθούς των εργαζομένων σε διαφορετικούς τομείς της οικονομίας. Εδώ λειτουργούμε με μια τυπική, χαρακτηριστική τιμή μιας μεταβλητής ιδιότητας, που αναφέρεται σε μια μονάδα μεγάλου πληθυσμού.

Ο μέσος όρος το αντικατοπτρίζει γενικός,που είναι τυπικό για όλες τις μονάδες του πληθυσμού που μελετήθηκε. Ταυτόχρονα, εξισορροπεί την επίδραση όλων των παραγόντων που δρουν στο μέγεθος της ιδιότητας των επιμέρους μονάδων του πληθυσμού, σαν να τις ακυρώνει αμοιβαία. Το επίπεδο (ή το μέγεθος) κάθε κοινωνικού φαινομένου καθορίζεται από τη δράση δύο ομάδων παραγόντων. Μερικά από αυτά είναι γενικά και κύρια, λειτουργούν συνεχώς, συνδέονται στενά με τη φύση του φαινομένου ή της διαδικασίας που μελετάται και αποτελούν τυπικόςγια όλες τις μονάδες του πληθυσμού που μελετήθηκε, το οποίο αντικατοπτρίζεται στη μέση τιμή. Άλλοι είναι άτομο,Η δράση τους είναι λιγότερο έντονη και είναι επεισοδιακή, τυχαία. Δρουν προς την αντίθετη κατεύθυνση, προκαλούν διαφορές μεταξύ των ποσοτικών χαρακτηριστικών επιμέρους μονάδων του πληθυσμού, επιδιώκοντας να αλλάξουν τη σταθερή τιμή των χαρακτηριστικών που μελετώνται. Η δράση των επιμέρους ζωδίων σβήνει στη μέση τιμή. Στη σωρευτική επιρροή τυπικών και μεμονωμένων παραγόντων, η οποία είναι ισορροπημένη και αμοιβαία ακυρώνεται σε γενικευμένα χαρακτηριστικά, εκδηλώνεται με γενική εικόναγνωστό από τη μαθηματική στατιστική θεμελιώδη νόμος των μεγάλων αριθμών.

Συνολικά, οι επιμέρους τιμές των ζωδίων συγχωνεύονται σε μια κοινή μάζα και, όπως ήταν, διαλύονται. Ως εκ τούτου και μέση αξίαλειτουργεί ως «απρόσωπο», το οποίο μπορεί να αποκλίνει από τις επιμέρους αξίες των χαρακτηριστικών, χωρίς να συμπίπτει ποσοτικά με κανένα από αυτά. Η μέση τιμή αντικατοπτρίζει τη γενική, χαρακτηριστική και τυπική για ολόκληρο τον πληθυσμό λόγω της αμοιβαίας ακύρωσης σε αυτόν τυχαίων, άτυπων διαφορών μεταξύ των σημείων των επιμέρους μονάδων του, αφού η τιμή του καθορίζεται, όπως λες, από το κοινό αποτέλεσμα όλων αιτίες.

Ωστόσο, για να αντικατοπτρίζει η μέση τιμή την πιο τυπική τιμή ενός χαρακτηριστικού, δεν θα πρέπει να προσδιορίζεται για κανέναν πληθυσμό, αλλά μόνο για πληθυσμούς που αποτελούνται από ποιοτικά ομοιογενείς μονάδες. Η απαίτηση αυτή αποτελεί την κύρια προϋπόθεση για την επιστημονικά τεκμηριωμένη εφαρμογή των μέσων όρων και συνεπάγεται στενή σύνδεση μεταξύ της μεθόδου των μέσων όρων και της μεθόδου των ομαδοποιήσεων στην ανάλυση κοινωνικοοικονομικών φαινομένων. Επομένως, η μέση τιμή είναι ένας γενικευμένος δείκτης που χαρακτηρίζει το τυπικό επίπεδο ενός μεταβλητού χαρακτηριστικού ανά μονάδα ενός ομοιογενούς πληθυσμού σε συγκεκριμένες συνθήκες τόπου και χρόνου.

Καθορίζοντας, επομένως, την ουσία των μέσων τιμών, πρέπει να τονιστεί ότι ο σωστός υπολογισμός οποιασδήποτε μέσης τιμής συνεπάγεται την εκπλήρωση των ακόλουθων απαιτήσεων:

  • ποιοτική ομοιογένεια του πληθυσμού στον οποίο υπολογίζεται η μέση τιμή. Αυτό σημαίνει ότι ο υπολογισμός των μέσων τιμών θα πρέπει να βασίζεται στη μέθοδο ομαδοποίησης, η οποία εξασφαλίζει την επιλογή ομοιογενών, ίδιου τύπου φαινομένων.
  • αποκλεισμός της επιρροής στον υπολογισμό της μέσης τιμής τυχαίων, καθαρά μεμονωμένων αιτιών και παραγόντων. Αυτό επιτυγχάνεται όταν ο υπολογισμός του μέσου όρου βασίζεται σε αρκετά ογκώδες υλικό στο οποίο εκδηλώνεται η λειτουργία του νόμου των μεγάλων αριθμών και όλα τα ατυχήματα αλληλοεξουδετερώνονται.
  • κατά τον υπολογισμό της μέσης τιμής, είναι σημαντικό να καθοριστεί ο σκοπός του υπολογισμού της και το λεγόμενο ορίζοντας δείκτη-τηλ(ιδιότητα) στην οποία θα πρέπει να προσανατολίζεται.

Ο καθοριστικός δείκτης μπορεί να λειτουργεί ως το άθροισμα των τιμών του μέσου όρου του χαρακτηριστικού, το άθροισμα των αμοιβαίων τιμών του, το γινόμενο των τιμών του κ.λπ. Η σχέση μεταξύ του καθοριστικού δείκτη και της μέσης τιμής εκφράζεται ως εξής: αν όλα Οι τιμές του μέσου όρου χαρακτηριστικού αντικαθίστανται από τη μέση τιμή, τότε το άθροισμα ή το γινόμενο τους σε αυτήν την περίπτωση δεν θα αλλάξει τον καθοριστικό δείκτη. Με βάση αυτή τη σύνδεση του προσδιοριστικού δείκτη με τη μέση τιμή, δημιουργείται μια αρχική ποσοτική αναλογία για τον άμεσο υπολογισμό της μέσης τιμής. Η ικανότητα των μέσων όρων να διατηρούν τις ιδιότητες των στατιστικών πληθυσμών ονομάζεται τον καθορισμό της ιδιοκτησίας.

Η μέση τιμή που υπολογίζεται για τον πληθυσμό συνολικά ονομάζεται γενικός μέσος όρος;Μέσες τιμές που υπολογίζονται για κάθε ομάδα - ομαδικούς μέσους όρους.Ο συνολικός μέσος όρος αντικατοπτρίζει κοινά χαρακτηριστικάτου υπό μελέτη φαινομένου, ο μέσος όρος της ομάδας χαρακτηρίζει το φαινόμενο που αναπτύσσεται κάτω από τις συγκεκριμένες συνθήκες της συγκεκριμένης ομάδας.

Οι μέθοδοι υπολογισμού μπορεί να είναι διαφορετικές, επομένως, στις στατιστικές, διακρίνονται διάφοροι τύποι μέσου όρου, οι κυριότεροι από τους οποίους είναι ο αριθμητικός μέσος όρος, ο αρμονικός μέσος όρος και ο γεωμετρικός μέσος όρος.

Στην οικονομική ανάλυση, η χρήση των μέσων όρων είναι το κύριο εργαλείο για την αξιολόγηση των αποτελεσμάτων της επιστημονικής και τεχνολογικής προόδου, των κοινωνικών μέτρων και της αναζήτησης αποθεμάτων για οικονομική ανάπτυξη. Ταυτόχρονα, πρέπει να θυμόμαστε ότι η υπερβολική εστίαση στους μέσους όρους μπορεί να οδηγήσει σε μεροληπτικά συμπεράσματα κατά τη διεξαγωγή οικονομικής και στατιστικής ανάλυσης. Αυτό οφείλεται στο γεγονός ότι οι μέσες τιμές, ως γενικευτικοί δείκτες, ακυρώνουν και αγνοούν εκείνες τις διαφορές στα ποσοτικά χαρακτηριστικά των επιμέρους μονάδων του πληθυσμού που πραγματικά υπάρχουν και μπορεί να έχουν ανεξάρτητο ενδιαφέρον.

Τύποι μέσων όρων

Στις στατιστικές, χρησιμοποιούνται διάφοροι τύποι μέσων όρων, οι οποίοι χωρίζονται σε δύο μεγάλες κατηγορίες:

  • μέσοι όροι ισχύος (αρμονικός μέσος όρος, γεωμετρικός μέσος όρος, αριθμητικός μέσος όρος, μέσος όρος τετράγωνο, μέσος κυβικός).
  • διαρθρωτικούς μέσους όρους (τρόπος λειτουργίας, διάμεσος).

Να υπολογίσω δύναμη σημαίνειπρέπει να χρησιμοποιούνται όλες οι διαθέσιμες χαρακτηριστικές τιμές. Μόδακαι διάμεσοςκαθορίζονται μόνο από τη δομή κατανομής, επομένως ονομάζονται δομικοί, μέσοι όροι θέσης. Η διάμεσος και ο τρόπος χρησιμοποιούνται συχνά ως μέσο χαρακτηριστικό σε εκείνους τους πληθυσμούς όπου ο υπολογισμός της μέσης εκθετικής είναι αδύνατος ή μη πρακτικός.

Ο πιο συνηθισμένος τύπος μέσου όρου είναι ο αριθμητικός μέσος όρος. Υπό αριθμητικός μέσος όροςνοείται ως μια τέτοια τιμή ενός χαρακτηριστικού που θα είχε κάθε μονάδα του πληθυσμού εάν το σύνολο όλων των τιμών του χαρακτηριστικού κατανεμήθηκε ομοιόμορφα σε όλες τις μονάδες του πληθυσμού. Ο υπολογισμός αυτής της τιμής μειώνεται στο άθροισμα όλων των τιμών της μεταβλητής ιδιότητας και στη διαίρεση του προκύπτοντος ποσού με τον συνολικό αριθμό των μονάδων πληθυσμού. Για παράδειγμα, πέντε εργάτες ολοκλήρωσαν μια παραγγελία για την κατασκευή ανταλλακτικών, ενώ ο πρώτος παρήγαγε 5 εξαρτήματα, ο δεύτερος - 7, ο τρίτος - 4, ο τέταρτος - 10, ο πέμπτος - 12. Επειδή στα αρχικά δεδομένα η αξία του καθενός Η επιλογή προέκυψε μόνο μία φορά, για να προσδιορίσετε τη μέση απόδοση ενός εργαζομένου θα πρέπει να εφαρμόσετε τον απλό αριθμητικό μέσο τύπο:

Δηλαδή, στο παράδειγμά μας, η μέση παραγωγή ενός εργάτη είναι ίση με

Μαζί με τον απλό αριθμητικό μέσο όρο μελετούν σταθμισμένος αριθμητικός μέσος όρος.Για παράδειγμα, ας υπολογίσουμε τη μέση ηλικία των μαθητών σε μια ομάδα 20 ατόμων των οποίων η ηλικία κυμαίνεται από 18 έως 22 ετών, όπου xi- παραλλαγές του μέσου όρου χαρακτηριστικού, fi- συχνότητα, η οποία δείχνει πόσες φορές εμφανίζεται i-thσυνολική αξία (Πίνακας 5.1).

Πίνακας 5.1

Μέση ηλικία μαθητών

Εφαρμόζοντας τον τύπο σταθμισμένου αριθμητικού μέσου όρου, παίρνουμε:


Για να επιλέξετε έναν σταθμισμένο αριθμητικό μέσο όρο, υπάρχει ορισμένος κανόνας: εάν υπάρχει μια σειρά δεδομένων για δύο δείκτες, για έναν από τους οποίους είναι απαραίτητο να υπολογιστεί

η μέση τιμή, και ταυτόχρονα, οι αριθμητικές τιμές του παρονομαστή του λογικού τύπου του είναι γνωστές και οι τιμές του αριθμητή είναι άγνωστες, αλλά μπορούν να βρεθούν ως γινόμενο του αυτούς τους δείκτες, τότε η μέση τιμή θα πρέπει να υπολογιστεί χρησιμοποιώντας τον αριθμητικό σταθμισμένο μέσο όρο.

Σε ορισμένες περιπτώσεις, η φύση των αρχικών στατιστικών δεδομένων είναι τέτοια που ο υπολογισμός του αριθμητικού μέσου όρου χάνει το νόημά του και ο μόνος γενικευμένος δείκτης μπορεί να είναι μόνο ένας άλλος τύπος μέσης τιμής - μέση αρμονική.Επί του παρόντος, οι υπολογιστικές ιδιότητες του αριθμητικού μέσου όρου έχουν χάσει τη σημασία τους στον υπολογισμό των γενικευμένων στατιστικών δεικτών λόγω της ευρείας εισαγωγής ηλεκτρονικών υπολογιστών. Η μέση αρμονική τιμή, η οποία είναι επίσης απλή και σταθμισμένη, έχει αποκτήσει μεγάλη πρακτική σημασία. Εάν οι αριθμητικές τιμές του αριθμητή του λογικού τύπου είναι γνωστές και οι τιμές του παρονομαστή είναι άγνωστες, αλλά μπορούν να βρεθούν ως ιδιωτική διαίρεση ενός δείκτη με έναν άλλο, τότε η μέση τιμή υπολογίζεται με τη σταθμισμένη αρμονικός μέσος τύπος.

Για παράδειγμα, ας γίνει γνωστό ότι το αυτοκίνητο διένυσε τα πρώτα 210 χλμ. με ταχύτητα 70 χλμ./ώρα και τα υπόλοιπα 150 χλμ. με ταχύτητα 75 χλμ./ώρα. Είναι αδύνατο να προσδιοριστεί η μέση ταχύτητα του αυτοκινήτου σε όλη τη διαδρομή των 360 km χρησιμοποιώντας τον αριθμητικό μέσο όρο. Αφού οι επιλογές είναι οι ταχύτητες σε επιμέρους τμήματα xj= 70 km/h και X2= 75 km/h, και τα βάρη (fi) είναι τα αντίστοιχα τμήματα της διαδρομής, τότε τα γινόμενα των επιλογών ανά βάρη δεν θα έχουν ούτε φυσική ούτε οικονομική σημασία. Σε αυτήν την περίπτωση, είναι λογικό να διαιρέσουμε τα τμήματα της διαδρομής στις αντίστοιχες ταχύτητες (επιλογές xi), δηλαδή στον χρόνο που αφιερώνεται στη διέλευση μεμονωμένων τμημάτων της διαδρομής (fi / xi). Εάν τα τμήματα της διαδρομής συμβολίζονται με fi, τότε ολόκληρη η διαδρομή εκφράζεται ως Σfi και ο χρόνος που δαπανάται σε ολόκληρη τη διαδρομή εκφράζεται ως Σ fi / xi , Στη συνέχεια, η μέση ταχύτητα μπορεί να βρεθεί ως το πηλίκο της συνολικής απόστασης διαιρούμενο με τον συνολικό χρόνο που δαπανήθηκε:

Στο παράδειγμά μας, παίρνουμε:

Εάν όταν χρησιμοποιείτε το μέσο αρμονικό βάρος όλων των επιλογών (f) είναι ίσα, τότε αντί του σταθμισμένου, μπορείτε να χρησιμοποιήσετε απλή (μη σταθμισμένη) αρμονική μέση:

όπου xi - μεμονωμένες επιλογές. n- τον αριθμό των παραλλαγών του μέσου όρου χαρακτηριστικού. Στο παράδειγμα με την ταχύτητα, θα μπορούσε να εφαρμοστεί ένας απλός αρμονικός μέσος όρος εάν τα τμήματα της διαδρομής που διανύθηκε με διαφορετικές ταχύτητες ήταν ίσα.

Οποιαδήποτε μέση τιμή θα πρέπει να υπολογίζεται έτσι ώστε όταν αντικαθιστά κάθε παραλλαγή του μέσου όρου χαρακτηριστικού, η τιμή κάποιου τελικού, γενικευτικού δείκτη, που σχετίζεται με τον μέσο όρο δείκτη, να μην αλλάζει. Έτσι, όταν αντικαθιστούμε τις πραγματικές ταχύτητες σε μεμονωμένα τμήματα της διαδρομής με τη μέση τιμή τους ( μέση ταχύτητα) δεν πρέπει να αλλάζει τη συνολική απόσταση.

Η μορφή (τύπος) της μέσης τιμής καθορίζεται από τη φύση (μηχανισμό) της σχέσης αυτού του τελικού δείκτη με τον μέσο όρο, επομένως ο τελικός δείκτης, η τιμή του οποίου δεν πρέπει να αλλάξει όταν οι επιλογές αντικατασταθούν από τη μέση τιμή τους , λέγεται καθοριστικό δείκτη.Για να εξαγάγετε τον τύπο μέσου όρου, πρέπει να συνθέσετε και να λύσετε μια εξίσωση χρησιμοποιώντας τη σχέση του μέσου όρου δείκτη με τον καθοριστικό. Αυτή η εξίσωση κατασκευάζεται αντικαθιστώντας τις παραλλαγές του μέσου όρου χαρακτηριστικού (δείκτη) με τη μέση τιμή τους.

Εκτός από τον αριθμητικό μέσο και τον αρμονικό μέσο όρο, στη στατιστική χρησιμοποιούνται και άλλοι τύποι (μορφές) του μέσου όρου. Όλες είναι ειδικές περιπτώσεις. βαθμός μέσος όρος.Εάν υπολογίσουμε όλους τους τύπους των μέσων όρων ισχύος-νόμου για τα ίδια δεδομένα, τότε οι τιμές

θα είναι τα ίδια, ο κανόνας ισχύει εδώ σπουδαιότηταςΜεσαίο. Καθώς αυξάνεται ο εκθέτης του μέσου όρου, αυξάνεται και ο ίδιος ο μέσος όρος. Οι πιο συχνά χρησιμοποιούμενοι τύποι υπολογισμού στην πρακτική έρευνα διάφορα είδηΟι μέσοι όροι ισχύος παρουσιάζονται στον Πίνακα. 5.2.

Πίνακας 5.2


Ο γεωμετρικός μέσος όρος εφαρμόζεται όταν είναι διαθέσιμος. nαυξητικούς παράγοντες, ενώ οι επιμέρους τιμές του χαρακτηριστικού είναι, κατά κανόνα, σχετικές τιμές της δυναμικής, χτισμένες με τη μορφή αλυσιδωτών τιμών, ως αναλογία προς το προηγούμενο επίπεδο κάθε επιπέδου στη σειρά δυναμικής. Ο μέσος όρος χαρακτηρίζει έτσι τον μέσο ρυθμό ανάπτυξης. γεωμετρική μέση απλήυπολογίζεται με τον τύπο

Τύπος γεωμετρικό μέσο σταθμισμένοέχει την εξής μορφή:

Οι παραπάνω τύποι είναι πανομοιότυποι, αλλά ο ένας εφαρμόζεται σε τρέχοντες συντελεστές ή ρυθμούς ανάπτυξης και ο δεύτερος - στις απόλυτες τιμές των επιπέδων της σειράς.

ρίζα μέσο τετράγωνοχρησιμοποιείται κατά τον υπολογισμό με τις τιμές των τετραγωνικών συναρτήσεων, χρησιμοποιείται για τη μέτρηση του βαθμού διακύμανσης των επιμέρους τιμών του χαρακτηριστικού γύρω από τον αριθμητικό μέσο όρο στη σειρά κατανομής και υπολογίζεται από τον τύπο

Μέσο σταθμισμένο τετράγωνουπολογίζεται με διαφορετικό τύπο:

Μέσο κυβικόχρησιμοποιείται κατά τον υπολογισμό με τις τιμές των κυβικών συναρτήσεων και υπολογίζεται από τον τύπο

σταθμισμένο μέσο κυβικό:

Όλες οι παραπάνω μέσες τιμές μπορούν να αναπαρασταθούν ως γενικός τύπος:

πού είναι η μέση τιμή? - ατομική αξία n- τον αριθμό των μονάδων του πληθυσμού που μελετήθηκε· κ- εκθέτης, ο οποίος καθορίζει τον τύπο του μέσου όρου.

Όταν χρησιμοποιείτε τα ίδια δεδομένα πηγής, τόσο περισσότερα κστον γενικό τύπο μέσης ισχύος, τόσο μεγαλύτερη είναι η μέση τιμή. Από αυτό προκύπτει ότι υπάρχει μια τακτική σχέση μεταξύ των αξιών των μέσων ισχύος:

Οι μέσες τιμές που περιγράφονται παραπάνω δίνουν μια γενικευμένη ιδέα του υπό μελέτη πληθυσμού και από αυτή την άποψη, η θεωρητική, εφαρμοσμένη και γνωστική σημασία τους είναι αδιαμφισβήτητη. Συμβαίνει όμως η τιμή του μέσου όρου να μην συμπίπτει με καμία από τις πραγματικά υπάρχουσες επιλογές, επομένως, εκτός από τους εξεταζόμενους μέσους όρους, στη στατιστική ανάλυση είναι σκόπιμο να χρησιμοποιηθούν οι τιμές συγκεκριμένων επιλογών που καταλαμβάνουν αρκετά καθορισμένη θέση σε μια διατεταγμένη (κατάταξη) σειρά τιμών χαρακτηριστικών. Μεταξύ αυτών των ποσοτήτων, οι πιο συχνά χρησιμοποιούμενες είναι κατασκευαστικός,ή περιγραφικός, μέσος όρος- λειτουργία (Mo) και διάμεσος (Me).

Μόδα- την αξία του χαρακτηριστικού που συναντάται συχνότερα σε αυτόν τον πληθυσμό. Όσον αφορά τη μεταβλητή σειρά, η λειτουργία είναι η πιο συχνά εμφανιζόμενη τιμή της σειράς κατάταξης, δηλαδή η παραλλαγή με την υψηλότερη συχνότητα. Η μόδα μπορεί να χρησιμοποιηθεί για τον προσδιορισμό των καταστημάτων με τις περισσότερες επισκέψεις, της πιο κοινής τιμής για οποιοδήποτε προϊόν. Δείχνει το μέγεθος του χαρακτηριστικού ενός σημαντικού μέρους του πληθυσμού και καθορίζεται από τον τύπο

όπου x0 είναι το κατώτερο όριο του διαστήματος. η- τιμή διαστήματος fm- συχνότητα διαστήματος fm_ 1 - συχνότητα του προηγούμενου διαστήματος. fm+ 1 - συχνότητα του επόμενου διαστήματος.

Διάμεσοςονομάζεται η παραλλαγή που βρίσκεται στο κέντρο της σειράς κατάταξης. Η διάμεσος χωρίζει τη σειρά σε δύο ίσα μέρη με τέτοιο τρόπο ώστε και στις δύο πλευρές της να υπάρχει ο ίδιος αριθμός πληθυσμιακών μονάδων. Ταυτόχρονα, στο ένα ήμισυ των μονάδων πληθυσμού, η τιμή της μεταβλητής είναι μικρότερη από τη διάμεσο, στο άλλο μισό είναι μεγαλύτερη από αυτήν. Η διάμεσος χρησιμοποιείται κατά την εξέταση ενός στοιχείου του οποίου η τιμή είναι μεγαλύτερη ή ίση ή ταυτόχρονα μικρότερη ή ίση με τα μισά στοιχεία της σειράς διανομής. Ο διάμεσος δίνει γενική ιδέαγια το πού συγκεντρώνονται οι τιμές του χαρακτηριστικού, με άλλα λόγια, πού βρίσκεται το κέντρο τους.

Ο περιγραφικός χαρακτήρας της διάμεσης τιμής εκδηλώνεται στο γεγονός ότι χαρακτηρίζει το ποσοτικό όριο των τιμών της μεταβλητής ιδιότητας, τις οποίες κατέχει το ήμισυ των μονάδων πληθυσμού. Το πρόβλημα της εύρεσης της διάμεσης τιμής για μια διακριτή μεταβλητή σειρά επιλύεται απλά. Αν δίνονται όλες οι μονάδες της σειράς αριθμοί ακολουθίας, τότε ο σειριακός αριθμός της διάμεσης παραλλαγής ορίζεται ως (n + 1) / 2 με περιττό αριθμό όρων n. Εάν ο αριθμός των όρων της σειράς είναι ζυγός, τότε η διάμεσος θα είναι η μέση τιμή δύο παραλλαγές με σειριακούς αριθμούς n/ 2 και n / 2 + 1.

Κατά τον προσδιορισμό της διάμεσης σειρής διακύμανσης διαστήματος, προσδιορίζεται πρώτα το διάστημα στο οποίο βρίσκεται (το διάμεσο διάστημα). Αυτό το διάστημα χαρακτηρίζεται από το γεγονός ότι το συσσωρευμένο άθροισμα των συχνοτήτων του είναι ίσο ή υπερβαίνει το μισό του αθροίσματος όλων των συχνοτήτων της σειράς. Ο υπολογισμός της διάμεσης τιμής της σειράς μεταβολής διαστήματος πραγματοποιείται σύμφωνα με τον τύπο

όπου X0- το κατώτερο όριο του διαστήματος. η- τιμή διαστήματος fm- συχνότητα διαστήματος φά- τον αριθμό των μελών της σειράς·

∫m-1 - το άθροισμα των συσσωρευμένων όρων της σειράς που προηγείται αυτής.

Μαζί με τη διάμεσο, για τον πληρέστερο χαρακτηρισμό της δομής του πληθυσμού που μελετήθηκε, χρησιμοποιούνται και άλλες τιμές επιλογών, οι οποίες καταλαμβάνουν μια αρκετά σαφή θέση στη σειρά κατάταξης. Αυτά περιλαμβάνουν τεταρτημόριακαι δεκατιανοί.Τα τεταρτημόρια διαιρούν τη σειρά με το άθροισμα των συχνοτήτων σε 4 ίσα μέρη και τα δεκατιανά - σε 10 ίσα μέρη. Υπάρχουν τρία τεταρτημόρια και εννέα δεκαδικά.

Η διάμεσος και ο τρόπος, σε αντίθεση με τον αριθμητικό μέσο όρο, δεν εξαλείφουν μεμονωμένες διαφορές στις τιμές μιας μεταβλητής ιδιότητας και, ως εκ τούτου, είναι πρόσθετα και πολύ σημαντικά χαρακτηριστικά του στατιστικού πληθυσμού. Στην πράξη, χρησιμοποιούνται συχνά αντί του μέσου όρου ή μαζί με αυτόν. Είναι ιδιαίτερα σκόπιμο να υπολογιστεί η διάμεσος και ο τρόπος λειτουργίας σε εκείνες τις περιπτώσεις όπου ο πληθυσμός που μελετήθηκε περιέχει έναν ορισμένο αριθμό μονάδων με πολύ μεγάλη ή πολύ μικρή τιμή του χαρακτηριστικού μεταβλητής. Αυτές οι τιμές των επιλογών, που δεν είναι πολύ χαρακτηριστικές για τον πληθυσμό, ενώ επηρεάζουν την τιμή του αριθμητικού μέσου όρου, δεν επηρεάζουν τις τιμές της διάμεσης τιμής και του τρόπου λειτουργίας, γεγονός που καθιστά τους τελευταίους πολύτιμους δείκτες για οικονομική και στατιστική ανάλυση .

Δείκτες διακύμανσης

Ο σκοπός μιας στατιστικής μελέτης είναι να προσδιορίσει τις κύριες ιδιότητες και πρότυπα του υπό μελέτη στατιστικού πληθυσμού. Στη διαδικασία της συνοπτικής επεξεργασίας των δεδομένων στατιστικής παρατήρησης, χτίζουμε γραμμές διανομής.Υπάρχουν δύο τύποι σειρών διανομής - αποδοτικές και μεταβλητές, ανάλογα με το αν το χαρακτηριστικό που λαμβάνεται ως βάση της ομαδοποίησης είναι ποιοτικό ή ποσοτικό.

μεταβλητήπου ονομάζονται σειρές διανομής που χτίζονται σε ποσοτική βάση. Οι τιμές των ποσοτικών χαρακτηριστικών για μεμονωμένες μονάδες του πληθυσμού δεν είναι σταθερές, λίγο πολύ διαφέρουν μεταξύ τους. Αυτή η διαφορά στην τιμή ενός χαρακτηριστικού ονομάζεται παραλλαγές.Ξεχωριστός αριθμητικές τιμέςχαρακτηριστικά που εμφανίζονται στον υπό μελέτη πληθυσμό ονομάζονται επιλογές αξίας.Η παρουσία διακύμανσης σε μεμονωμένες μονάδες του πληθυσμού οφείλεται στην επίδραση ενός μεγάλου αριθμού παραγόντων στο σχηματισμό του επιπέδου χαρακτηριστικών. Η μελέτη της φύσης και του βαθμού διακύμανσης των σημείων σε επιμέρους μονάδες του πληθυσμού είναι το σημαντικότερο θέμα κάθε στατιστικής μελέτης. Οι δείκτες διακύμανσης χρησιμοποιούνται για να περιγράψουν το μέτρο της μεταβλητότητας των χαρακτηριστικών.

Ένα άλλο σημαντικό καθήκον της στατιστικής έρευνας είναι ο προσδιορισμός του ρόλου μεμονωμένων παραγόντων ή των ομάδων τους στη διακύμανση ορισμένων χαρακτηριστικών του πληθυσμού. Για να λύσουμε αυτό το πρόβλημα στα στατιστικά, ειδικές μεθόδουςμελέτες παραλλαγής που βασίζονται στη χρήση μιας κάρτας βαθμολογίας που μετρά τη διακύμανση. Στην πράξη, ο ερευνητής έρχεται αντιμέτωπος με αρκετά μεγάλη ποσότηταεπιλογές για τις τιμές του χαρακτηριστικού, το οποίο δεν δίνει μια ιδέα για την κατανομή των μονάδων με την τιμή του χαρακτηριστικού στο σύνολο. Για να γίνει αυτό, όλες οι παραλλαγές των τιμών των χαρακτηριστικών ταξινομούνται σε αύξουσα ή φθίνουσα σειρά. Αυτή η διαδικασία ονομάζεται κατάταξη σειρών.Η σειρά κατάταξης δίνει αμέσως μια γενική ιδέα για τις τιμές που παίρνει το χαρακτηριστικό στο σύνολο.

Η ανεπάρκεια της μέσης τιμής για έναν εξαντλητικό χαρακτηρισμό του πληθυσμού καθιστά απαραίτητη τη συμπλήρωση των μέσων τιμών με δείκτες που καθιστούν δυνατή την αξιολόγηση της τυπικότητας αυτών των μέσων όρων μετρώντας τη διακύμανση (παραλλαγή) του υπό μελέτη χαρακτηριστικού. Η χρήση αυτών των δεικτών διακύμανσης καθιστά δυνατή την πληρέστερη και ουσιαστικότερη στατιστική ανάλυση και, κατά συνέπεια, την καλύτερη κατανόηση της ουσίας των κοινωνικών φαινομένων που μελετήθηκαν.

Τα πιο απλά σημάδια παραλλαγής είναι ελάχιστοκαι το μέγιστο -είναι το μικρότερο και υψηλότερη τιμήχαρακτηριστικό στο σύνολο. Ο αριθμός των επαναλήψεων των μεμονωμένων παραλλαγών των τιμών χαρακτηριστικών ονομάζεται ρυθμός επανάληψης.Ας υποδηλώσουμε τη συχνότητα επανάληψης της τιμής του χαρακτηριστικού fi,το άθροισμα των συχνοτήτων ίσο με τον όγκο του πληθυσμού που μελετήθηκε θα είναι:

όπου κ- αριθμός παραλλαγών τιμών χαρακτηριστικών. Είναι βολικό να αντικαταστήσετε τις συχνότητες με συχνότητες - w.i. Συχνότητα- δείκτης σχετικής συχνότητας - μπορεί να εκφραστεί σε κλάσματα μονάδας ή σε ποσοστό και σας επιτρέπει να συγκρίνετε σειρές παραλλαγών με διαφορετικό αριθμό παρατηρήσεων. Επίσημα έχουμε:

Για τη μέτρηση της διακύμανσης ενός χαρακτηριστικού, χρησιμοποιούνται διάφοροι απόλυτοι και σχετικοί δείκτες. Οι απόλυτοι δείκτες διακύμανσης περιλαμβάνουν τη μέση γραμμική απόκλιση, το εύρος διακύμανσης, διακύμανση, τυπική απόκλιση.

Παραλλαγή ανοιγμάτων(R) είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του χαρακτηριστικού στον υπό μελέτη πληθυσμό: R= Xmax - Xmin. Αυτός ο δείκτης δίνει μόνο την πιο γενική ιδέα της διακύμανσης του υπό μελέτη χαρακτηριστικού, καθώς δείχνει τη διαφορά μόνο μεταξύ των οριακών τιμών των παραλλαγών. Είναι εντελώς άσχετο με τις συχνότητες της μεταβλητής σειράς, δηλαδή με τη φύση της κατανομής και η εξάρτησή της μπορεί να της δώσει έναν ασταθή, τυχαίο χαρακτήρα μόνο από τις ακραίες τιμές του χαρακτηριστικού. Το εύρος διακύμανσης δεν παρέχει πληροφορίες σχετικά με τα χαρακτηριστικά των πληθυσμών που μελετήθηκαν και δεν μας επιτρέπει να εκτιμήσουμε τον βαθμό τυπικότητας των λαμβανόμενων μέσων τιμών. Το εύρος αυτού του δείκτη περιορίζεται σε αρκετά ομοιογενείς πληθυσμούς, πιο συγκεκριμένα, χαρακτηρίζει την παραλλαγή ενός χαρακτηριστικού, έναν δείκτη που βασίζεται στη συνεκτίμηση της μεταβλητότητας όλων των τιμών του χαρακτηριστικού.

Για να χαρακτηριστεί η παραλλαγή ενός χαρακτηριστικού, είναι απαραίτητο να γενικευθούν οι αποκλίσεις όλων των τιμών από οποιαδήποτε τιμή τυπική για τον υπό μελέτη πληθυσμό. Τέτοιοι δείκτες

παραλλαγές, όπως η μέση γραμμική απόκλιση, η διακύμανση και η τυπική απόκλιση, βασίζονται στην εξέταση των αποκλίσεων των τιμών του χαρακτηριστικού των επιμέρους μονάδων του πληθυσμού από τον αριθμητικό μέσο όρο.

Μέση γραμμική απόκλισηείναι ο αριθμητικός μέσος όρος των απόλυτων τιμών των αποκλίσεων μεμονωμένων επιλογών από τον αριθμητικό τους μέσο όρο:


Η απόλυτη τιμή (μέτρο) της απόκλισης της παραλλαγής από τον αριθμητικό μέσο όρο. φά-συχνότητα.

Ο πρώτος τύπος εφαρμόζεται εάν καθεμία από τις επιλογές εμφανίζεται συνολικά μόνο μία φορά και ο δεύτερος - σε σειρά με άνισες συχνότητες.

Υπάρχει ένας άλλος τρόπος για τον μέσο όρο των αποκλίσεων των επιλογών από τον αριθμητικό μέσο όρο. Αυτή η μέθοδος, η οποία είναι πολύ διαδεδομένη στα στατιστικά, περιορίζεται στον υπολογισμό των τετραγωνικών αποκλίσεων των επιλογών από τη μέση τιμή και στη συνέχεια στον υπολογισμό του μέσου όρου τους. Σε αυτή την περίπτωση, παίρνουμε έναν νέο δείκτη διακύμανσης - τη διακύμανση.

Διασπορά(σ 2) - ο μέσος όρος των τετραγωνικών αποκλίσεων των παραλλαγών των τιμών των χαρακτηριστικών από τη μέση τιμή τους:

Ο δεύτερος τύπος χρησιμοποιείται εάν οι παραλλαγές έχουν τα δικά τους βάρη (ή τις συχνότητες της σειράς παραλλαγών).

Στην οικονομική και στατιστική ανάλυση, είναι σύνηθες να αξιολογείται η παραλλαγή ενός χαρακτηριστικού πιο συχνά χρησιμοποιώντας την τυπική απόκλιση. Τυπική απόκλιση(σ) είναι η τετραγωνική ρίζα της διακύμανσης:

Οι μέσες γραμμικές και μέσες αποκλίσεις τετραγώνου δείχνουν πόσο κυμαίνεται η τιμή του χαρακτηριστικού κατά μέσο όρο για τις μονάδες του υπό μελέτη πληθυσμού και εκφράζονται στις ίδιες μονάδες με τις παραλλαγές.

Στη στατιστική πρακτική, συχνά καθίσταται απαραίτητο να συγκρίνουμε την ποικιλία των διαφόρων χαρακτηριστικών. Για παράδειγμα, έχει μεγάλο ενδιαφέρον να συγκρίνουμε τις διακυμάνσεις στην ηλικία του προσωπικού και τα προσόντα του, τη διάρκεια υπηρεσίας και τους μισθούς κ.λπ. Για τέτοιες συγκρίσεις, οι δείκτες της απόλυτης μεταβλητότητας των σημείων - η μέση γραμμική και τυπική απόκλιση - δεν είναι κατάλληλοι . Είναι αδύνατο, στην πραγματικότητα, να συγκριθεί η διακύμανση της εργασιακής εμπειρίας, που εκφράζεται σε χρόνια, με τη διακύμανση των μισθών, που εκφράζεται σε ρούβλια και καπίκια.

Κατά τη σύγκριση της μεταβλητότητας διαφόρων χαρακτηριστικών στο σύνολο, είναι βολικό να χρησιμοποιηθούν σχετικοί δείκτες διακύμανσης. Αυτοί οι δείκτες υπολογίζονται ως ο λόγος των απόλυτων δεικτών προς τον αριθμητικό μέσο όρο (ή διάμεσο). Χρησιμοποιώντας ως απόλυτο δείκτη διακύμανσης το εύρος διακύμανσης, τη μέση γραμμική απόκλιση, την τυπική απόκλιση, λαμβάνει κανείς τους σχετικούς δείκτες διακύμανσης:


Ο πιο συχνά χρησιμοποιούμενος δείκτης σχετικής μεταβλητότητας, που χαρακτηρίζει την ομοιογένεια του πληθυσμού. Το σύνολο θεωρείται ομοιογενές εάν ο συντελεστής διακύμανσης δεν υπερβαίνει το 33% για κατανομές κοντά στο κανονικό.

Στις περισσότερες περιπτώσεις, τα δεδομένα συγκεντρώνονται γύρω από κάποιο κεντρικό σημείο. Έτσι, για να περιγράψουμε οποιοδήποτε σύνολο δεδομένων, αρκεί να υποδείξουμε τη μέση τιμή. Εξετάστε διαδοχικά τρία αριθμητικά χαρακτηριστικά που χρησιμοποιούνται για την εκτίμηση της μέσης τιμής της κατανομής: αριθμητικός μέσος όρος, διάμεσος και τρόπος λειτουργίας.

Μέση τιμή

Ο αριθμητικός μέσος όρος (συχνά αναφέρεται απλώς ως μέσος όρος) είναι η πιο κοινή εκτίμηση του μέσου όρου μιας κατανομής. Είναι το αποτέλεσμα της διαίρεσης του αθροίσματος όλων των παρατηρούμενων αριθμητικών τιμών με τον αριθμό τους. Για ένα δείγμα αριθμών Χ 1, Χ 2, ..., Χn, ο μέσος όρος του δείγματος (σημειώνεται με το σύμβολο ) ισοδυναμεί \u003d (X 1 + X 2 + ... + Xn) / n, ή

πού είναι ο μέσος όρος του δείγματος, n- το μέγεθος του δείγματος, ΧΕγώi-ο στοιχείοδείγματα.

Λήψη σημείωσης σε ή μορφή, παραδείγματα σε μορφή

Εξετάστε τον υπολογισμό του μέσου όρου αριθμητική τιμήπενταετείς μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου (Σχήμα 1).

Ρύζι. 1. Μέση ετήσια απόδοση 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου

Ο μέσος όρος του δείγματος υπολογίζεται ως εξής:

Αυτή είναι μια καλή απόδοση, ειδικά σε σύγκριση με την απόδοση 3-4% που έλαβαν οι καταθέτες τραπεζών ή πιστωτικών ενώσεων την ίδια χρονική περίοδο. Εάν ταξινομήσετε τις τιμές απόδοσης, είναι εύκολο να δείτε ότι οκτώ αμοιβαία κεφάλαια έχουν απόδοση πάνω από το μέσο όρο και επτά - κάτω από το μέσο όρο. Ο αριθμητικός μέσος όρος λειτουργεί ως σημείο ισορροπίας, έτσι ώστε τα κεφάλαια χαμηλού εισοδήματος να εξισορροπούν τα κεφάλαια υψηλού εισοδήματος. Όλα τα στοιχεία του δείγματος εμπλέκονται στον υπολογισμό του μέσου όρου. Κανένας από τους άλλους εκτιμητές του μέσου όρου κατανομής δεν έχει αυτήν την ιδιότητα.

Πότε να υπολογίσετε τον αριθμητικό μέσο όρο.Δεδομένου ότι ο αριθμητικός μέσος όρος εξαρτάται από όλα τα στοιχεία του δείγματος, η παρουσία ακραίων τιμών επηρεάζει σημαντικά το αποτέλεσμα. Σε τέτοιες περιπτώσεις, ο αριθμητικός μέσος όρος μπορεί να παραμορφώσει την έννοια των αριθμητικών δεδομένων. Επομένως, κατά την περιγραφή ενός συνόλου δεδομένων που περιέχει ακραίες τιμές, είναι απαραίτητο να υποδεικνύεται η διάμεσος ή ο αριθμητικός μέσος όρος και η διάμεσος. Για παράδειγμα, εάν η απόδοση του αμοιβαίου κεφαλαίου της Αναδυόμενης Ανάπτυξης της RS αφαιρεθεί από το δείγμα, ο μέσος όρος του δείγματος της απόδοσης των 14 κεφαλαίων μειώνεται σχεδόν κατά 1% σε 5,19%.

Διάμεσος

Η διάμεσος είναι η μεσαία τιμή ενός διατεταγμένου πίνακα αριθμών. Εάν ο πίνακας δεν περιέχει επαναλαμβανόμενους αριθμούς, τότε τα μισά στοιχεία του θα είναι μικρότερα και μισά περισσότερα από τη διάμεσο. Εάν το δείγμα περιέχει ακραίες τιμές, είναι προτιμότερο να χρησιμοποιηθεί η διάμεσος παρά ο αριθμητικός μέσος όρος για την εκτίμηση του μέσου όρου. Για να υπολογιστεί η διάμεσος ενός δείγματος, πρέπει πρώτα να ταξινομηθεί.

Αυτή η φόρμουλα είναι διφορούμενη. Το αποτέλεσμά του εξαρτάται από το αν ο αριθμός είναι άρτιος ή μονός. n:

  • Εάν το δείγμα περιέχει περιττός αριθμόςστοιχεία, η διάμεσος είναι (n+1)/2-ο στοιχείο.
  • Εάν το δείγμα περιέχει ζυγό αριθμό στοιχείων, η διάμεσος βρίσκεται μεταξύ των δύο μεσαίων στοιχείων του δείγματος και ισούται με τον αριθμητικό μέσο όρο που υπολογίζεται σε αυτά τα δύο στοιχεία.

Για να υπολογίσουμε τη διάμεση τιμή για ένα δείγμα 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου, πρέπει πρώτα να ταξινομήσουμε τα πρωτογενή δεδομένα (Εικόνα 2). Τότε η διάμεσος θα είναι απέναντι από τον αριθμό του μεσαίου στοιχείου του δείγματος. στο παράδειγμά μας με αριθμό 8. Το Excel έχει ειδική λειτουργία=MEDIAN(), που λειτουργεί και με μη ταξινομημένους πίνακες.

Ρύζι. 2. Διάμεσος 15 ταμεία

Έτσι, η διάμεσος είναι 6,5. Αυτό σημαίνει ότι τα μισά από τα κεφάλαια πολύ υψηλού κινδύνου δεν ξεπερνούν τα 6,5, ενώ τα άλλα μισά το κάνουν. Σημειώστε ότι η διάμεσος του 6,5 είναι ελαφρώς μεγαλύτερη από τη διάμεσο του 6,08.

Εάν αφαιρέσουμε την κερδοφορία του αμοιβαίου κεφαλαίου RS Emerging Growth από το δείγμα, τότε η διάμεση τιμή των υπόλοιπων 14 κεφαλαίων θα μειωθεί στο 6,2%, δηλαδή όχι τόσο σημαντικά όσο ο αριθμητικός μέσος όρος (Εικ. 3).

Ρύζι. 3. Διάμεσος 14 ταμεία

Μόδα

Ο όρος εισήχθη για πρώτη φορά από τον Pearson το 1894. Η μόδα είναι ο αριθμός που εμφανίζεται πιο συχνά στο δείγμα (το πιο μοδάτο). Η μόδα περιγράφει καλά, για παράδειγμα, την τυπική αντίδραση των οδηγών σε ένα σήμα κυκλοφορίας για διακοπή της κυκλοφορίας. Κλασικό παράδειγμαχρήση της μόδας - η επιλογή του μεγέθους της παραγόμενης παρτίδας παπουτσιών ή του χρώματος της ταπετσαρίας. Εάν μια διανομή έχει πολλαπλούς τρόπους λειτουργίας, τότε λέγεται ότι είναι πολυτροπική ή πολυτροπική (έχει δύο ή περισσότερες "κορυφές"). Η πολυτροπική κατανομή παρέχει σημαντικές πληροφορίες για τη φύση της υπό μελέτη μεταβλητής. Για παράδειγμα, σε κοινωνιολογικές έρευνες, εάν μια μεταβλητή αντιπροσωπεύει μια προτίμηση ή στάση απέναντι σε κάτι, τότε η πολυτροπικότητα θα μπορούσε να σημαίνει ότι υπάρχουν πολλές σαφώς διαφορετικές απόψεις. Η πολυτροπικότητα είναι επίσης ένας δείκτης ότι το δείγμα δεν είναι ομοιογενές και ότι οι παρατηρήσεις μπορεί να δημιουργηθούν από δύο ή περισσότερες «επικαλυπτόμενες» κατανομές. Σε αντίθεση με τον αριθμητικό μέσο όρο, οι ακραίες τιμές δεν επηρεάζουν τη λειτουργία. Για τυχαίες μεταβλητές που κατανέμονται συνεχώς, όπως οι μέσες ετήσιες αποδόσεις των αμοιβαίων κεφαλαίων, η λειτουργία μερικές φορές δεν υπάρχει καθόλου (ή δεν έχει νόημα). Δεδομένου ότι αυτοί οι δείκτες μπορούν να λάβουν μια ποικιλία τιμών, οι επαναλαμβανόμενες τιμές είναι εξαιρετικά σπάνιες.

τεταρτημόρια

Τα τεταρτημόρια είναι μέτρα που χρησιμοποιούνται πιο συχνά για την αξιολόγηση της κατανομής των δεδομένων κατά την περιγραφή των ιδιοτήτων μεγάλων αριθμητικών δειγμάτων. Ενώ η διάμεσος χωρίζει τον ταξινομημένο πίνακα στο μισό (50% των στοιχείων του πίνακα είναι λιγότερα από το διάμεσο και το 50% είναι μεγαλύτερα), τα τεταρτημόρια διαχωρίζουν το ταξινομημένο σύνολο δεδομένων σε τέσσερα μέρη. Οι τιμές Q 1 , διάμεσος και Q 3 είναι το 25ο, 50ο και 75ο εκατοστημόριο, αντίστοιχα. Το πρώτο τεταρτημόριο Q 1 είναι ένας αριθμός που χωρίζει το δείγμα σε δύο μέρη: το 25% των στοιχείων είναι μικρότερα από και το 75% είναι περισσότερα από το πρώτο τεταρτημόριο.

Το τρίτο τεταρτημόριο Q 3 είναι ένας αριθμός που χωρίζει επίσης το δείγμα σε δύο μέρη: το 75% των στοιχείων είναι μικρότερα από και το 25% είναι περισσότερα από το τρίτο τεταρτημόριο.

Για τον υπολογισμό τεταρτημορίων σε εκδόσεις του Excel πριν από το 2007, χρησιμοποιήθηκε η συνάρτηση =QUARTILE (πίνακας, τμήμα). Ξεκινώντας με το Excel 2010, ισχύουν δύο λειτουργίες:

  • =QUARTILE.ON (πίνακας, τμήμα)
  • =QUARTILE.EXC(πίνακας, μέρος)

Αυτές οι δύο λειτουργίες δίνουν λίγο διάφορες έννοιες(Εικ. 4). Για παράδειγμα, κατά τον υπολογισμό των τεταρτημορίων ενός δείγματος που περιέχει δεδομένα για τη μέση ετήσια απόδοση 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου, Q 1 = 1,8 ή -0,7 για QUARTILE.INC και QUARTILE.EXC, αντίστοιχα. Παρεμπιπτόντως, η συνάρτηση QUARTILE που χρησιμοποιήθηκε νωρίτερα αντιστοιχεί στη σύγχρονη συνάρτηση QUARTILE.ON. Για να υπολογίσετε τεταρτημόρια στο Excel χρησιμοποιώντας τους παραπάνω τύπους, ο πίνακας δεδομένων μπορεί να παραμείνει χωρίς σειρά.

Ρύζι. 4. Υπολογίστε τεταρτημόρια στο Excel

Να τονίσουμε ξανά. Το Excel μπορεί να υπολογίσει τεταρτημόρια για μονομεταβλητή διακριτές σειρές, που περιέχει τις τιμές μιας τυχαίας μεταβλητής. Ο υπολογισμός των τεταρτημορίων για μια κατανομή με βάση τη συχνότητα δίνεται στην παρακάτω ενότητα.

γεωμετρικό μέσο

Σε αντίθεση με τον αριθμητικό μέσο όρο, ο γεωμετρικός μέσος όρος μετρά πόσο έχει αλλάξει μια μεταβλητή με την πάροδο του χρόνου. Το γεωμετρικό μέσο είναι η ρίζα nου βαθμού από το προϊόν nτιμές (στο Excel, χρησιμοποιείται η συνάρτηση = CUGEOM):

σολ= (X 1 * X 2 * ... * X n) 1/n

Μια παρόμοια παράμετρος - ο γεωμετρικός μέσος όρος του ρυθμού απόδοσης - καθορίζεται από τον τύπο:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

όπου R i- ποσοστό απόδοσης Εγώ-η χρονική περίοδος.

Για παράδειγμα, ας υποθέσουμε ότι η αρχική επένδυση είναι 100.000 $. Μέχρι το τέλος του πρώτου έτους, πέφτει στα 50.000 $ και μέχρι το τέλος του δεύτερου έτους, επανέρχεται στα αρχικά 100.000 $. Το ποσοστό απόδοσης αυτής της επένδυσης σε διάστημα δύο περίοδος έτους είναι ίση με 0, αφού το αρχικό και το τελικό ποσό των κεφαλαίων είναι ίσα μεταξύ τους. Ωστόσο, ο αριθμητικός μέσος όρος των ετήσιων ποσοστών απόδοσης είναι = (-0,5 + 1) / 2 = 0,25 ή 25%, δεδομένου ότι το ποσοστό απόδοσης το πρώτο έτος R 1 = (50.000 - 100.000) / 100.000 = -0,5 , και στο δεύτερο R 2 = (100.000 - 50.000) / 50.000 = 1. Ταυτόχρονα, ο γεωμετρικός μέσος όρος του ποσοστού απόδοσης για δύο χρόνια είναι: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Έτσι, ο γεωμετρικός μέσος όρος αντικατοπτρίζει με μεγαλύτερη ακρίβεια τη μεταβολή (ακριβέστερα, την απουσία αλλαγής) στον όγκο των επενδύσεων κατά τη διετία από τον αριθμητικό μέσο όρο.

Ενδιαφέροντα γεγονότα.Πρώτον, ο γεωμετρικός μέσος όρος θα είναι πάντα μικρότερος από τον αριθμητικό μέσο όρο των ίδιων αριθμών. Εκτός από την περίπτωση που όλοι οι αριθμοί που λαμβάνονται είναι ίσοι μεταξύ τους. Δεύτερον, λαμβάνοντας υπόψη τις ιδιότητες ορθογώνιο τρίγωνο, μπορείτε να καταλάβετε γιατί ο μέσος όρος ονομάζεται γεωμετρικός. Το ύψος ενός ορθογώνιου τριγώνου, χαμηλωμένο στην υποτείνουσα, είναι η μέση αναλογία μεταξύ των προεξοχών των ποδιών στην υποτείνουσα, και κάθε σκέλος είναι η μέση αναλογία μεταξύ της υποτείνουσας και της προβολής της στην υποτείνουσα (Εικ. 5). Αυτό δίνει έναν γεωμετρικό τρόπο κατασκευής του γεωμετρικού μέσου όρου δύο (μήκη) τμημάτων: πρέπει να χτίσετε έναν κύκλο στο άθροισμα αυτών των δύο τμημάτων ως διάμετρο και, στη συνέχεια, το ύψος, που θα αποκατασταθεί από το σημείο της σύνδεσής τους στη διασταύρωση με το κύκλος, θα δώσει την απαιτούμενη τιμή:

Ρύζι. 5. Η γεωμετρική φύση του γεωμετρικού μέσου (σχήμα από τη Wikipedia)

Η δεύτερη σημαντική ιδιότητα των αριθμητικών δεδομένων είναι το δικό τους παραλλαγήχαρακτηρίζοντας το βαθμό διασποράς των δεδομένων. Δύο διαφορετικά δείγματα μπορεί να διαφέρουν τόσο σε μέσες τιμές όσο και σε παραλλαγές. Ωστόσο, όπως φαίνεται στο σχ. 6 και 7, δύο δείγματα μπορεί να έχουν την ίδια παραλλαγή αλλά διαφορετικά μέσα ή τον ίδιο μέσο όρο και εντελώς διαφορετική παραλλαγή. Τα δεδομένα που αντιστοιχούν στο πολύγωνο Β στο Σχ. 7 αλλάζουν πολύ λιγότερο από τα δεδομένα από τα οποία κατασκευάστηκε το πολύγωνο Α.

Ρύζι. 6. Δύο συμμετρικές κατανομές σε σχήμα καμπάνας με το ίδιο spread και διαφορετικές μέσες τιμές

Ρύζι. 7. Δύο συμμετρικές κατανομές σε σχήμα καμπάνας με τις ίδιες μέσες τιμές και διαφορετική διασπορά

Υπάρχουν πέντε εκτιμήσεις της διακύμανσης των δεδομένων:

  • σπιθαμή,
  • διατεταρτημοριακό εύρος,
  • διασπορά,
  • τυπική απόκλιση,
  • ο συντελεστής διακύμανσης.

πεδίο εφαρμογής

Το εύρος είναι η διαφορά μεταξύ του μεγαλύτερου και του μικρότερου στοιχείου του δείγματος:

Σύρετε = XMax-XΕλάχ

Το εύρος ενός δείγματος που περιέχει τις μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου μπορεί να υπολογιστεί χρησιμοποιώντας έναν ταξινομημένο πίνακα (βλ. Εικόνα 4): εύρος = 18,5 - (-6,1) = 24,6. Αυτό σημαίνει ότι η διαφορά μεταξύ της υψηλότερης και της χαμηλότερης μέσης ετήσιας απόδοσης για αμοιβαία κεφάλαια πολύ υψηλού κινδύνου είναι 24,6%.

Το εύρος μετρά τη συνολική εξάπλωση των δεδομένων. Αν και το εύρος του δείγματος είναι μια πολύ απλή εκτίμηση της συνολικής εξάπλωσης των δεδομένων, η αδυναμία του είναι ότι δεν λαμβάνει υπόψη ακριβώς τον τρόπο κατανομής των δεδομένων μεταξύ του ελάχιστου και του μέγιστου στοιχείου. Αυτό το αποτέλεσμα φαίνεται καλά στο Σχ. 8 που απεικονίζει δείγματα που έχουν το ίδιο εύρος. Η κλίμακα Β δείχνει ότι εάν το δείγμα περιέχει τουλάχιστον μία ακραία τιμή, το εύρος του δείγματος είναι μια πολύ ανακριβής εκτίμηση της διασποράς των δεδομένων.

Ρύζι. 8. Σύγκριση τριών δειγμάτων με το ίδιο εύρος. το τρίγωνο συμβολίζει την υποστήριξη της ισορροπίας και η θέση του αντιστοιχεί στη μέση τιμή του δείγματος

Διατεταρτημοριακό εύρος

Το διατεταρτημόριο ή το μέσο εύρος είναι η διαφορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου του δείγματος:

Εύρος διατεταρτημορίου \u003d Q 3 - Q 1

Αυτή η τιμή καθιστά δυνατό να εκτιμηθεί η εξάπλωση του 50% των στοιχείων και να μην ληφθεί υπόψη η επίδραση των ακραίων στοιχείων. Το διατεταρτημόριο για ένα δείγμα που περιέχει δεδομένα για τις μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου μπορεί να υπολογιστεί χρησιμοποιώντας τα δεδομένα στο Σχήμα. 4 (για παράδειγμα, για τη συνάρτηση QUARTILE.EXC): Εύρος διατεταρτημορίου = 9,8 - (-0,7) = 10,5. Το διάστημα μεταξύ 9,8 και -0,7 αναφέρεται συχνά ως μεσαίο μισό.

Πρέπει να σημειωθεί ότι οι τιμές Q 1 και Q 3, και ως εκ τούτου το διατεταρτημόριο, δεν εξαρτώνται από την παρουσία ακραίων τιμών, καθώς ο υπολογισμός τους δεν λαμβάνει υπόψη καμία τιμή μικρότερη από Q 1 ή μεγαλύτερη από Q 3 . Τα συνολικά ποσοτικά χαρακτηριστικά, όπως η διάμεσος, το πρώτο και το τρίτο τεταρτημόριο και το διατεταρτημόριο, τα οποία δεν επηρεάζονται από ακραίες τιμές, ονομάζονται ισχυροί δείκτες.

Ενώ το εύρος και το διατεταρτημόριο εύρος παρέχουν μια εκτίμηση της συνολικής και της μέσης διασποράς του δείγματος, αντίστοιχα, καμία από αυτές τις εκτιμήσεις δεν λαμβάνει υπόψη ακριβώς τον τρόπο με τον οποίο κατανέμονται τα δεδομένα. Διακύμανση και τυπική απόκλισηαπαλλαγμένο από αυτό το μειονέκτημα. Αυτοί οι δείκτες σάς επιτρέπουν να αξιολογήσετε τον βαθμό διακύμανσης των δεδομένων γύρω από τον μέσο όρο. Διακύμανση δείγματοςείναι μια προσέγγιση του αριθμητικού μέσου όρου που υπολογίζεται από τις τετραγωνικές διαφορές μεταξύ κάθε στοιχείου δείγματος και του μέσου όρου του δείγματος. Για ένα δείγμα X 1 , X 2 , ... X n η διακύμανση του δείγματος (που συμβολίζεται με το σύμβολο S 2 δίνεται με τον ακόλουθο τύπο:

Γενικά, η διακύμανση του δείγματος είναι το άθροισμα των τετραγωνικών διαφορών μεταξύ των στοιχείων του δείγματος και του μέσου όρου του δείγματος, διαιρούμενο με μια τιμή ίση με το μέγεθος του δείγματος μείον ένα:

όπου - αριθμητικός μέσος όρος, n- το μέγεθος του δείγματος, X i - Εγώ-ο δείγμα στοιχείου Χ. Στο Excel πριν από την έκδοση 2007, η συνάρτηση =VAR() χρησιμοποιήθηκε για τον υπολογισμό της διακύμανσης του δείγματος, από την έκδοση 2010, χρησιμοποιείται η συνάρτηση =VAR.V().

Η πιο πρακτική και ευρέως αποδεκτή εκτίμηση της διασποράς δεδομένων είναι τυπική απόκλιση. Αυτός ο δείκτης συμβολίζεται με το σύμβολο S και ισούται με τετραγωνική ρίζααπό τη διακύμανση του δείγματος:

Στο Excel πριν από την έκδοση 2007, η συνάρτηση =STDEV() χρησιμοποιήθηκε για τον υπολογισμό της τυπικής απόκλισης, από την έκδοση 2010 χρησιμοποιείται η συνάρτηση =STDEV.B(). Για τον υπολογισμό αυτών των συναρτήσεων, ο πίνακας δεδομένων μπορεί να είναι μη ταξινομημένος.

Ούτε η διακύμανση του δείγματος ούτε η τυπική απόκλιση του δείγματος μπορεί να είναι αρνητικές. Η μόνη περίπτωση στην οποία οι δείκτες S 2 και S μπορούν να είναι μηδενικοί είναι εάν όλα τα στοιχεία του δείγματος είναι ίσα. Σε αυτή την εντελώς απίθανη περίπτωση, το εύρος και το εύρος του διατεταρτημορίου είναι επίσης μηδέν.

Τα αριθμητικά δεδομένα είναι εγγενώς ασταθή. Οποιαδήποτε μεταβλητή μπορεί να πάρει ένα σύνολο διαφορετικές αξίες. Για παράδειγμα, διαφορετικά αμοιβαία κεφάλαια έχουν διαφορετικά ποσοστά απόδοσης και ζημιών. Λόγω της μεταβλητότητας των αριθμητικών δεδομένων, είναι πολύ σημαντικό να μελετηθούν όχι μόνο εκτιμήσεις του μέσου όρου, οι οποίες έχουν αθροιστικό χαρακτήρα, αλλά και εκτιμήσεις της διακύμανσης, που χαρακτηρίζουν τη διασπορά των δεδομένων.

Η διακύμανση και η τυπική απόκλιση μας επιτρέπουν να εκτιμήσουμε την εξάπλωση των δεδομένων γύρω από τον μέσο όρο, με άλλα λόγια, να καθορίσουμε πόσα στοιχεία του δείγματος είναι λιγότερα από το μέσο όρο και πόσα είναι μεγαλύτερα. Η διασπορά έχει μερικές πολύτιμες μαθηματικές ιδιότητες. Ωστόσο, η τιμή του είναι το τετράγωνο μιας μονάδας μέτρησης - ένα τετραγωνικό ποσοστό, ένα τετραγωνικό δολάριο, μια τετραγωνική ίντσα κ.λπ. Επομένως, μια φυσική εκτίμηση της διακύμανσης είναι η τυπική απόκλιση, η οποία εκφράζεται στις συνήθεις μονάδες μέτρησης - ποσοστό εισοδήματος, δολάρια ή ίντσες.

Η τυπική απόκλιση σάς επιτρέπει να υπολογίσετε το μέγεθος της διακύμανσης των στοιχείων του δείγματος γύρω από τη μέση τιμή. Σχεδόν σε όλες τις περιπτώσεις, η πλειονότητα των παρατηρούμενων τιμών βρίσκεται εντός συν ή πλην μίας τυπικής απόκλισης από τη μέση τιμή. Επομένως, γνωρίζοντας τον αριθμητικό μέσο όρο των στοιχείων του δείγματος και την τυπική απόκλιση του δείγματος, είναι δυνατό να προσδιοριστεί το διάστημα στο οποίο ανήκει ο κύριος όγκος των δεδομένων.

Η τυπική απόκλιση των αποδόσεων σε 15 αμοιβαία κεφάλαια πολύ υψηλού κινδύνου είναι 6,6 (Εικόνα 9). Αυτό σημαίνει ότι η κερδοφορία του μεγαλύτερου μέρους των κεφαλαίων διαφέρει από τη μέση αξία κατά όχι περισσότερο από 6,6% (δηλαδή, κυμαίνεται στο εύρος από – Σ= 6,2 – 6,6 = –0,4 έως +S= 12,8). Μάλιστα, αυτό το διάστημα περιέχει μέση ετήσια απόδοση 53,3% (8 στα 15) πενταετίας.

Ρύζι. 9. Τυπική απόκλιση

Σημειώστε ότι κατά τη διαδικασία άθροισης των τετραγωνικών διαφορών, τα στοιχεία που είναι πιο μακριά από τη μέση κερδίζουν περισσότερο βάρος από τα στοιχεία που είναι πιο κοντά. Αυτή η ιδιότητα είναι ο κύριος λόγος για τον οποίο ο αριθμητικός μέσος όρος χρησιμοποιείται συχνότερα για την εκτίμηση του μέσου όρου μιας κατανομής.

Ο συντελεστής διακύμανσης

Σε αντίθεση με προηγούμενες εκτιμήσεις διασποράς, ο συντελεστής διακύμανσης είναι μια σχετική εκτίμηση. Μετριέται πάντα ως ποσοστό, όχι στις αρχικές μονάδες δεδομένων. Ο συντελεστής διακύμανσης, που συμβολίζεται με τα σύμβολα CV, μετρά τη διασπορά των δεδομένων γύρω από τη μέση τιμή. Ο συντελεστής διακύμανσης είναι ίσος με την τυπική απόκλιση διαιρούμενη με τον αριθμητικό μέσο όρο και πολλαπλασιαζόμενη επί 100%:

όπου μικρό- τυπική απόκλιση δείγματος, - μέσος όρος δείγματος.

Ο συντελεστής διακύμανσης σας επιτρέπει να συγκρίνετε δύο δείγματα, τα στοιχεία των οποίων εκφράζονται σε διαφορετικές μονάδες μέτρησης. Για παράδειγμα, ο διαχειριστής μιας υπηρεσίας παράδοσης αλληλογραφίας σκοπεύει να αναβαθμίσει τον στόλο των φορτηγών. Κατά τη φόρτωση συσκευασιών, υπάρχουν δύο τύποι περιορισμών που πρέπει να ληφθούν υπόψη: το βάρος (σε λίβρες) και ο όγκος (σε κυβικά πόδια) κάθε συσκευασίας. Ας υποθέσουμε ότι σε ένα δείγμα 200 σακουλών, το μέσο βάρος είναι 26,0 λίβρες, η τυπική απόκλιση του βάρους είναι 3,9 λίβρες, ο μέσος όγκος συσκευασίας είναι 8,8 κυβικά πόδια και η τυπική απόκλιση του όγκου είναι 2,2 κυβικά πόδια. Πώς να συγκρίνετε το spread του βάρους και του όγκου των πακέτων;

Δεδομένου ότι οι μονάδες μέτρησης για το βάρος και τον όγκο διαφέρουν μεταξύ τους, ο διαχειριστής πρέπει να συγκρίνει τη σχετική διασπορά αυτών των τιμών. Ο συντελεστής διακύμανσης βάρους είναι CV W = 3,9 / 26,0 * 100% = 15%, και ο συντελεστής διακύμανσης όγκου CV V = 2,2 / 8,8 * 100% = 25% . Έτσι, η σχετική διασπορά των όγκων πακέτων είναι πολύ μεγαλύτερη από τη σχετική διασπορά των βαρών τους.

Φόρμα διανομής

Η τρίτη σημαντική ιδιότητα του δείγματος είναι η μορφή της κατανομής του. Αυτή η κατανομή μπορεί να είναι συμμετρική ή ασύμμετρη. Για να περιγραφεί το σχήμα μιας κατανομής, είναι απαραίτητο να υπολογιστεί ο μέσος όρος και η διάμεσος. Εάν αυτά τα δύο μέτρα είναι τα ίδια, η μεταβλητή λέγεται ότι είναι συμμετρικά κατανεμημένη. Εάν η μέση τιμή μιας μεταβλητής είναι μεγαλύτερη από τη διάμεσο, η κατανομή της έχει θετική λοξότητα (Εικ. 10). Εάν η διάμεσος είναι μεγαλύτερη από τη μέση, η κατανομή της μεταβλητής είναι αρνητικά λοξή. Η θετική λοξότητα εμφανίζεται όταν ο μέσος όρος αυξάνεται σε ασυνήθιστα υψηλές αξίες. Η αρνητική λοξότητα εμφανίζεται όταν ο μέσος όρος μειώνεται σε ασυνήθιστα μικρές τιμές. Μια μεταβλητή κατανέμεται συμμετρικά εάν δεν λάβει ακραίες τιμές προς οποιαδήποτε κατεύθυνση, έτσι ώστε οι μεγάλες και οι μικρές τιμές της μεταβλητής να αλληλοεξουδετερώνονται.

Ρύζι. 10. Τρεις τύποι διανομών

Τα δεδομένα που απεικονίζονται στην κλίμακα Α έχουν αρνητική λοξότητα. Αυτό το σχήμα δείχνει μια μακριά ουρά και μια αριστερή λοξή που προκαλείται από ασυνήθιστα μικρές τιμές. Αυτές οι εξαιρετικά μικρές τιμές μετατοπίζουν τη μέση τιμή προς τα αριστερά και γίνεται μικρότερη από τη διάμεση τιμή. Τα δεδομένα που εμφανίζονται στην κλίμακα Β κατανέμονται συμμετρικά. Το αριστερό και το δεξί μισό της κατανομής είναι οι κατοπτρικές τους εικόνες. Οι μεγάλες και οι μικρές τιμές εξισορροπούν η μία την άλλη και ο μέσος όρος και ο διάμεσος είναι ίσοι. Τα δεδομένα που εμφανίζονται στην κλίμακα Β έχουν θετική λοξότητα. Αυτό το σχήμα δείχνει μια μακριά ουρά και μια λοξή προς τα δεξιά, που προκαλούνται από την παρουσία ασυνήθιστα υψηλών τιμών. Αυτές οι πολύ μεγάλες τιμές μετατοπίζουν τον μέσο όρο προς τα δεξιά και γίνεται μεγαλύτερος από τον διάμεσο.

Στο Excel, μπορείτε να λάβετε περιγραφικά στατιστικά στοιχεία χρησιμοποιώντας το πρόσθετο Πακέτο ανάλυσης. Περάστε από το μενού ΔεδομέναΑνάλυση δεδομένων, στο παράθυρο που ανοίγει, επιλέξτε τη γραμμή Περιγραφικά στατιστικάκαι κάντε κλικ Εντάξει. Στο παράθυρο Περιγραφικά στατιστικάφροντίστε να υποδείξετε διάστημα εισαγωγής(Εικ. 11). Εάν θέλετε να δείτε περιγραφικά στατιστικά στοιχεία στο ίδιο φύλλο με τα αρχικά δεδομένα, επιλέξτε το κουμπί επιλογής διάστημα εξόδουκαι καθορίστε το κελί στο οποίο θέλετε να τοποθετήσετε την επάνω αριστερή γωνία των εμφανιζόμενων στατιστικών (στο παράδειγμά μας, $C$1). Εάν θέλετε να στείλετε δεδομένα σε ΝΕΟ ΦΥΛΛΟή μέσα καινούργιο βιβλίοαπλά επιλέξτε το κατάλληλο κουμπί επιλογής. Επιλέξτε το πλαίσιο δίπλα Τελικά στατιστικά στοιχεία. Προαιρετικά, μπορείτε επίσης να επιλέξετε Επίπεδο δυσκολίας,κ-ο μικρότερο καικ-ο μεγαλύτερος.

Εάν είναι σε κατάθεση Δεδομέναστην περιοχή του Ανάλυσηδεν βλέπετε το εικονίδιο Ανάλυση δεδομένων, πρέπει πρώτα να εγκαταστήσετε το πρόσθετο Πακέτο ανάλυσης(βλ., για παράδειγμα,).

Ρύζι. 11. Περιγραφικά στατιστικά στοιχεία των πενταετών μέσων ετήσιων αποδόσεων κεφαλαίων με πολύ υψηλά επίπεδα κινδύνου, που υπολογίζονται με τη χρήση του πρόσθετου Ανάλυση δεδομένωνΠρογράμματα Excel

Το Excel υπολογίζει έναν αριθμό στατιστικών που συζητήθηκαν παραπάνω: μέσος όρος, διάμεσος, τρόπος, τυπική απόκλιση, διακύμανση, εύρος ( διάστημα), ελάχιστο, μέγιστο και μέγεθος δείγματος ( έλεγχος). Επιπλέον, το Excel υπολογίζει ορισμένα νέα στατιστικά στοιχεία για εμάς: τυπικό σφάλμα, κύρτωση και λοξότητα. τυπικό σφάλμαισούται με την τυπική απόκλιση διαιρούμενη με την τετραγωνική ρίζα του μεγέθους του δείγματος. ασυμμετρίαχαρακτηρίζει την απόκλιση από τη συμμετρία της κατανομής και είναι μια συνάρτηση που εξαρτάται από τον κύβο των διαφορών μεταξύ των στοιχείων του δείγματος και της μέσης τιμής. Η κούρτωση είναι ένα μέτρο της σχετικής συγκέντρωσης δεδομένων γύρω από τον μέσο όρο σε σχέση με τις ουρές της κατανομής και εξαρτάται από τις διαφορές μεταξύ του δείγματος και του μέσου όρου που αυξάνεται στην τέταρτη ισχύ.

Υπολογισμός περιγραφικών στατιστικών για το γενικό πληθυσμό

Ο μέσος όρος, η διασπορά και το σχήμα της κατανομής που συζητήθηκαν παραπάνω είναι χαρακτηριστικά που βασίζονται σε δείγμα. Ωστόσο, εάν το σύνολο δεδομένων περιέχει αριθμητικές μετρήσεις ολόκληρου του πληθυσμού, τότε οι παράμετροί του μπορούν να υπολογιστούν. Αυτές οι παράμετροι περιλαμβάνουν τον μέσο όρο, τη διακύμανση και την τυπική απόκλιση του πληθυσμού.

Αναμενόμενη αξίαισούται με το άθροισμα όλων των τιμών του γενικού πληθυσμού διαιρεμένο με τον όγκο του γενικού πληθυσμού:

όπου µ - αναμενόμενη αξία, ΧΕγώ- Εγώ-η μεταβλητή παρατήρηση Χ, Ν- τον όγκο του γενικού πληθυσμού. Στο Excel για υπολογισμό μαθηματική προσδοκίαχρησιμοποιείται η ίδια συνάρτηση με τον αριθμητικό μέσο όρο: =AVERAGE().

Διακύμανση πληθυσμούίσο με το άθροισμα των τετραγωνικών διαφορών μεταξύ των στοιχείων του γενικού πληθυσμού και του ματ. προσδοκίες διαιρεμένες με το μέγεθος του πληθυσμού:

όπου σ2είναι η διακύμανση του γενικού πληθυσμού. Το Excel πριν από την έκδοση 2007 χρησιμοποιεί τη συνάρτηση =VAR() για να υπολογίσει τη διακύμανση του πληθυσμού, ξεκινώντας από την έκδοση 2010 =VAR.G().

τυπική απόκλιση πληθυσμούισούται με την τετραγωνική ρίζα της διακύμανσης του πληθυσμού:

Το Excel πριν από την έκδοση 2007 χρησιμοποιεί το =STDEV() για τον υπολογισμό της τυπικής απόκλισης του πληθυσμού, ξεκινώντας με την έκδοση 2010 =STDEV.Y(). Σημειώστε ότι οι τύποι για τη διακύμανση πληθυσμού και την τυπική απόκλιση είναι διαφορετικοί από τους τύπους για τη διακύμανση του δείγματος και την τυπική απόκλιση. Κατά τον υπολογισμό των στατιστικών δειγμάτων S2και μικρόο παρονομαστής του κλάσματος είναι n - 1, και κατά τον υπολογισμό των παραμέτρων σ2και σ - τον όγκο του γενικού πληθυσμού Ν.

εμπειρικός κανόνας

Στις περισσότερες περιπτώσεις, ένα μεγάλο ποσοστό παρατηρήσεων συγκεντρώνεται γύρω από τη διάμεσο, σχηματίζοντας ένα σύμπλεγμα. Σε σύνολα δεδομένων με θετική λοξότητα, αυτό το σύμπλεγμα βρίσκεται στα αριστερά (δηλαδή, κάτω) της μαθηματικής προσδοκίας και σε σύνολα με αρνητική λοξότητα, αυτό το σύμπλεγμα βρίσκεται στα δεξιά (δηλαδή, πάνω) της μαθηματικής προσδοκίας. Τα συμμετρικά δεδομένα έχουν τον ίδιο μέσο όρο και διάμεσο, και οι παρατηρήσεις συγκεντρώνονται γύρω από το μέσο όρο, σχηματίζοντας μια κατανομή σε σχήμα καμπάνας. Εάν η κατανομή δεν έχει έντονη λοξότητα και τα δεδομένα συγκεντρώνονται γύρω από ένα συγκεκριμένο κέντρο βάρους, μπορεί να χρησιμοποιηθεί ένας εμπειρικός κανόνας για την εκτίμηση της μεταβλητότητας, ο οποίος λέει: εάν τα δεδομένα έχουν κατανομή σε σχήμα καμπάνας, τότε περίπου το 68% από τις παρατηρήσεις είναι μικρότερη από μία τυπική απόκλιση από τη μαθηματική προσδοκία, Περίπου το 95% των παρατηρήσεων είναι εντός δύο τυπικών αποκλίσεων από την αναμενόμενη τιμή και το 99,7% των παρατηρήσεων είναι εντός τριών τυπικών αποκλίσεων από την αναμενόμενη τιμή.

Έτσι, η τυπική απόκλιση, η οποία είναι μια εκτίμηση της μέσης διακύμανσης γύρω από τη μαθηματική προσδοκία, βοηθά στην κατανόηση του τρόπου κατανομής των παρατηρήσεων και στον προσδιορισμό των ακραίων τιμών. Από τον εμπειρικό κανόνα προκύπτει ότι για κατανομές σε σχήμα καμπάνας, μόνο μία τιμή στις είκοσι διαφέρει από τη μαθηματική προσδοκία κατά περισσότερες από δύο τυπικές αποκλίσεις. Επομένως, τιμές εκτός του διαστήματος μ ± 2σ, μπορούν να θεωρηθούν ακραίες τιμές. Επιπλέον, μόνο τρεις στις 1000 παρατηρήσεις διαφέρουν από τις μαθηματικές προσδοκίες κατά περισσότερες από τρεις τυπικές αποκλίσεις. Έτσι, τιμές εκτός του διαστήματος μ ± 3σείναι σχεδόν πάντα ακραίες. Για διανομές που είναι πολύ λοξές ή δεν έχουν σχήμα καμπάνας, μπορεί να εφαρμοστεί ο εμπειρικός κανόνας Biename-Chebyshev.

Πριν από περισσότερα από εκατό χρόνια, οι μαθηματικοί Bienamay και Chebyshev ανακάλυψαν ανεξάρτητα μια χρήσιμη ιδιότητα της τυπικής απόκλισης. Βρήκαν ότι για οποιοδήποτε σύνολο δεδομένων, ανεξάρτητα από το σχήμα της κατανομής, το ποσοστό των παρατηρήσεων που βρίσκονται σε απόσταση που δεν υπερβαίνει κτυπικές αποκλίσεις από τις μαθηματικές προσδοκίες, όχι λιγότερες (1 – 1/ 2)*100%.

Για παράδειγμα, εάν κ= 2, ο κανόνας Biename-Chebyshev δηλώνει ότι τουλάχιστον (1 - (1/2) 2) x 100% = 75% των παρατηρήσεων πρέπει να βρίσκονται στο διάστημα μ ± 2σ. Αυτός ο κανόνας ισχύει για οποιονδήποτε κυπερβαίνει το ένα. Ο κανόνας Biename-Chebyshev είναι πολύ γενικού χαρακτήρακαι ισχύει για διανομές κάθε είδους. Υποδεικνύει τον ελάχιστο αριθμό παρατηρήσεων, η απόσταση από την οποία μέχρι τη μαθηματική προσδοκία δεν υπερβαίνει μια δεδομένη τιμή. Ωστόσο, εάν η κατανομή είναι σε σχήμα καμπάνας, ο εμπειρικός κανόνας εκτιμά με μεγαλύτερη ακρίβεια τη συγκέντρωση των δεδομένων γύρω από τη μέση τιμή.

Υπολογισμός περιγραφικών στατιστικών για μια κατανομή με βάση τη συχνότητα

Εάν τα αρχικά δεδομένα δεν είναι διαθέσιμα, η κατανομή συχνότητας γίνεται η μόνη πηγή πληροφοριών. Σε τέτοιες περιπτώσεις, μπορείτε να υπολογίσετε τις κατά προσέγγιση τιμές των ποσοτικών δεικτών της κατανομής, όπως ο αριθμητικός μέσος όρος, η τυπική απόκλιση, τα τεταρτημόρια.

Εάν τα δεδομένα του δείγματος παρουσιάζονται ως κατανομή συχνότητας, μπορεί να υπολογιστεί μια κατά προσέγγιση τιμή του αριθμητικού μέσου όρου, υποθέτοντας ότι όλες οι τιμές σε κάθε κατηγορία συγκεντρώνονται στο μέσο της κατηγορίας:

όπου - μέσος όρος δείγματος, n- αριθμός παρατηρήσεων ή μέγεθος δείγματος, Με- τον αριθμό των κλάσεων στην κατανομή συχνότητας, mj- μεσαίο σημείο ι-η τάξη, φάι- συχνότητα που αντιστοιχεί σε ι-η τάξη.

Για τον υπολογισμό της τυπικής απόκλισης από την κατανομή συχνότητας, θεωρείται επίσης ότι όλες οι τιμές σε κάθε κατηγορία συγκεντρώνονται στο μέσο της κατηγορίας.

Για να κατανοήσουμε πώς καθορίζονται τα τεταρτημόρια της σειράς με βάση τις συχνότητες, ας εξετάσουμε τον υπολογισμό του κατώτερου τεταρτημορίου με βάση τα δεδομένα για το 2013 σχετικά με την κατανομή του ρωσικού πληθυσμού κατά μέσο κατά κεφαλήν εισόδημα σε μετρητά (Εικ. 12).

Ρύζι. 12. Το μερίδιο του πληθυσμού της Ρωσίας με μέσο κατά κεφαλήν εισόδημα σε μετρητάμέσος όρος ανά μήνα, ρούβλια

Για να υπολογίσετε το πρώτο τεταρτημόριο της σειράς παραλλαγής διαστήματος, μπορείτε να χρησιμοποιήσετε τον τύπο:

όπου Q1 είναι η τιμή του πρώτου τεταρτημορίου, xQ1 είναι το κατώτερο όριο του διαστήματος που περιέχει το πρώτο τεταρτημόριο (το διάστημα καθορίζεται από τη συσσωρευμένη συχνότητα, η πρώτη υπερβαίνει το 25%). i είναι η τιμή του διαστήματος. Σf είναι το άθροισμα των συχνοτήτων ολόκληρου του δείγματος. πιθανώς πάντα ίσο με 100%? SQ1–1 είναι η αθροιστική συχνότητα του διαστήματος που προηγείται του διαστήματος που περιέχει το κατώτερο τεταρτημόριο. fQ1 είναι η συχνότητα του διαστήματος που περιέχει το κατώτερο τεταρτημόριο. Ο τύπος για το τρίτο τεταρτημόριο διαφέρει στο ότι σε όλα τα μέρη, αντί για Q1, πρέπει να χρησιμοποιήσετε το Q3 και να αντικαταστήσετε το ¾ αντί για το ¼.

Στο παράδειγμά μας (Εικ. 12), το κατώτερο τεταρτημόριο είναι στην περιοχή 7000,1 - 10,000, η ​​αθροιστική συχνότητα του οποίου είναι 26,4%. Συμπέρασμααυτό το διάστημα είναι 7000 ρούβλια, η τιμή του διαστήματος είναι 3000 ρούβλια, η συσσωρευμένη συχνότητα του διαστήματος που προηγείται του διαστήματος που περιέχει το κάτω τεταρτημόριο είναι 13,4%, η συχνότητα του διαστήματος που περιέχει το κάτω τεταρτημόριο είναι 13,0%. Έτσι: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 ρούβλια.

Παγίδες που σχετίζονται με περιγραφικές στατιστικές

Σε αυτό το σημείωμα, εξετάσαμε πώς να περιγράψουμε ένα σύνολο δεδομένων χρησιμοποιώντας διάφορα στατιστικά στοιχεία που εκτιμούν τον μέσο όρο, τη διασπορά και την κατανομή του. Το επόμενο βήμα είναι η ανάλυση και η ερμηνεία των δεδομένων. Μέχρι στιγμής, μελετήσαμε τις αντικειμενικές ιδιότητες των δεδομένων και τώρα στραφούμε στην υποκειμενική ερμηνεία τους. Δύο λάθη περιμένουν τον ερευνητή: ένα εσφαλμένα επιλεγμένο θέμα ανάλυσης και μια εσφαλμένη ερμηνεία των αποτελεσμάτων.

Η ανάλυση της απόδοσης 15 αμοιβαίων κεφαλαίων πολύ υψηλού κινδύνου είναι αρκετά αμερόληπτη. Οδήγησε σε εντελώς αντικειμενικά συμπεράσματα: όλα τα αμοιβαία κεφάλαια έχουν διαφορετικές αποδόσεις, το spread των αποδόσεων των αμοιβαίων κεφαλαίων κυμαίνεται από -6,1 έως 18,5 και η μέση απόδοση είναι 6,08. Η αντικειμενικότητα της ανάλυσης δεδομένων διασφαλίζεται από τη σωστή επιλογή των συνολικών ποσοτικών δεικτών της κατανομής. Εξετάστηκαν διάφορες μέθοδοι για την εκτίμηση του μέσου όρου και της διασποράς των δεδομένων και αναφέρθηκαν τα πλεονεκτήματα και τα μειονεκτήματά τους. Πώς να επιλέξετε τα σωστά στατιστικά στοιχεία που παρέχουν μια αντικειμενική και αμερόληπτη ανάλυση; Εάν η κατανομή των δεδομένων είναι ελαφρώς λοξή, πρέπει να επιλεγεί η διάμεσος έναντι του αριθμητικού μέσου όρου; Ποιος δείκτης χαρακτηρίζει με μεγαλύτερη ακρίβεια την εξάπλωση των δεδομένων: τυπική απόκλιση ή εύρος; Πρέπει να αναφέρεται η θετική λοξότητα της κατανομής;

Από την άλλη πλευρά, η ερμηνεία δεδομένων είναι μια υποκειμενική διαδικασία. Διαφορετικοί άνθρωποι καταλήγουν σε διαφορετικά συμπεράσματα, ερμηνεύοντας τα ίδια αποτελέσματα. Ο καθένας έχει τη δική του άποψη. Κάποιος θεωρεί ότι οι συνολικές μέσες ετήσιες αποδόσεις 15 αμοιβαίων κεφαλαίων με πολύ υψηλό επίπεδο κινδύνου είναι καλές και είναι αρκετά ικανοποιημένος με το εισόδημα που εισπράττει. Άλλοι μπορεί να πιστεύουν ότι αυτά τα κεφάλαια έχουν πολύ χαμηλές αποδόσεις. Έτσι, η υποκειμενικότητα θα πρέπει να αντισταθμίζεται από την ειλικρίνεια, την ουδετερότητα και τη σαφήνεια των συμπερασμάτων.

Ηθικά ζητήματα

Η ανάλυση δεδομένων είναι άρρηκτα συνδεδεμένη με ηθικά ζητήματα. Κάποιος πρέπει να είναι επικριτικός απέναντι στις πληροφορίες που διαδίδονται από τις εφημερίδες, το ραδιόφωνο, την τηλεόραση και το Διαδίκτυο. Με τον καιρό, θα μάθετε να είστε δύσπιστοι όχι μόνο για τα αποτελέσματα, αλλά και για τους στόχους, το αντικείμενο και την αντικειμενικότητα της έρευνας. Ο διάσημος Βρετανός πολιτικός Benjamin Disraeli το είπε καλύτερα: «Υπάρχουν τρία είδη ψεμάτων: ψέματα, καταραμένα ψέματα και στατιστικές».

Όπως σημειώνεται στη σημείωση, προκύπτουν ηθικά ζητήματα κατά την επιλογή των αποτελεσμάτων που πρέπει να παρουσιάζονται στην έκθεση. Θα πρέπει να δημοσιεύονται τόσο τα θετικά όσο και τα αρνητικά αποτελέσματα. Επιπλέον, όταν κάνετε μια αναφορά ή γραπτή αναφορά, τα αποτελέσματα πρέπει να παρουσιάζονται ειλικρινά, ουδέτερα και αντικειμενικά. Διακρίνετε τις κακές και τις ανέντιμες παρουσιάσεις. Για να γίνει αυτό, είναι απαραίτητο να προσδιοριστούν ποιες ήταν οι προθέσεις του ομιλητή. Μερικές φορές ο ομιλητής παραλείπει σημαντικές πληροφορίες από άγνοια, και μερικές φορές εσκεμμένα (για παράδειγμα, εάν χρησιμοποιεί τον αριθμητικό μέσο όρο για να εκτιμήσει τη μέση τιμή των σαφώς λοξών δεδομένων για να πάρει το επιθυμητό αποτέλεσμα). Είναι επίσης ανέντιμο να καταστείλουμε αποτελέσματα που δεν ανταποκρίνονται στην άποψη του ερευνητή.

Χρησιμοποιούνται υλικά από το βιβλίο Levin et al Στατιστικά για μάνατζερ. - Μ.: Williams, 2004. - Σελ. 178–209

Η συνάρτηση QUARTILE διατηρήθηκε για ευθυγράμμιση με προηγούμενες εκδόσεις του Excel