Michael Pyrcz, PhD, P.Eng (Daytum Founding Advisor)

Γεια σε όλους! Πιστεύουμε ότι οι έννοιες της στατιστικής μπορεί μερικές φορές να είναι εκφοβιστικές και φαινομενικά εσωτερικές. Ωστόσο, γνωρίζουμε ότι δεν χρειάζεται να είναι.

Ένα πράγμα που θέλαμε να κάνουμε ήταν να απλοποιήσουμε μερικά από τα κοινά χρησιμοποιούμενα λεξιλόγια στατιστικών και τους ορισμούς "Εξηγήστε σαν να είμαι 5". Παρακάτω είναι μια λίστα με τους 10 κορυφαίους όρους που πιστεύουμε ότι θα ενισχύσουν τις γεωστατιστικές σας δεξιότητες.

Μη διστάσετε να σχολιάσετε παρακάτω με αιτήματα για περισσότερους όρους ή οποιεσδήποτε άλλες προτάσεις έχετε για αυτήν τη λίστα!

1)Bootstrap — Η πρακτική της εκτίμησης των ιδιοτήτων ενός εκτιμητή (όπως η διακύμανσή του) με τη μέτρηση αυτών των ιδιοτήτων κατά τη δειγματοληψία από μια κατανομή κατά προσέγγιση.

Υπολογισμός της αβεβαιότητας σε ένα στατιστικό δείγμα με επαναδειγματοληψία από το ίδιο το δείγμα!

2) Ομαδοποίηση — Ομαδοποίηση δειγμάτων σε σύνολα γνωστά ως συμπλέγματα, έτσι ώστε οι διαφορές εντός των συστάδων να ελαχιστοποιούνται και η διαφορά μεταξύ των συστάδων να μεγιστοποιείται.

Ομαδοποίηση σημείων δεδομένων με βάση τα χαρακτηριστικά τους (σκεφτείτε να διαχωρίσετε τα μήλα και τα πορτοκάλια ανά χρώμα).

3) Ετεροσκεδαστικότητα — Η στατιστική διασπορά δεν είναι συνεπής σε όλους τους υποπληθυσμούς μιας μεταβλητής.

Αλλαγές διακύμανσης στο σύνολο δεδομένων.

4) Καταλογισμός — Η διαδικασία αντικατάστασης δεδομένων που λείπουν με αντικατασταθείσες τιμές.

Συμπλήρωση δεδομένων που λείπουν με αντιπροσωπευτικές τιμές.

5) Προομοίωση Μόντε Κάρλο — Επαναλαμβανόμενη τυχαία δειγματοληψία για την επίλυση ενός αριθμητικού προβλήματος, που συχνά εφαρμόζεται για να αναπαραστήσει την αβεβαιότητα.

Μια μέθοδος ωμής βίας που συνδυάζει μεμονωμένες κατανομές για να βρει μια συνολική κατανομή πληθυσμού.

6) Πολυσυγγραμμικότητα — Μια κατάσταση αλληλεπιδράσεων μεταξύ των ανεξάρτητων μεταβλητών.

Δύο+ μεταβλητές σε ένα μοντέλο παλινδρόμησης σχετίζονται πολύ γραμμικά.

7) Υπερβολές — Ένα στατιστικό μοντέλο που περιέχει περισσότερες παραμέτρους από αυτές που μπορούν να δικαιολογηθούν από τα δεδομένα.

Ξεκινώντας να μοντελοποιείτε την ενόχληση και τον θόρυβο στα δεδομένα και θα κάνει κακή πρόβλεψη μακριά από δεδομένα.

8) Ανάλυση κύριας συνιστώσας (PCA) — Μέθοδος μείωσης διαστάσεων μεγάλων συνόλων δεδομένων, μετατρέποντας ένα μεγάλο σύνολο μεταβλητών σε ένα μικρότερο που εξακολουθεί να περιέχει τις περισσότερες από τις πληροφορίες στο μεγάλο σύνολο

Μια περιστροφή που βρίσκει τους συνδυασμούς χαρακτηριστικών με τις περισσότερες πληροφορίες.

9) Σταθερότητα — Το στατιστικό ενδιαφέρον είναι αμετάβλητο κατά τη μετάφραση.

Η κατανομή είναι σταθερή με μετατόπιση.

10) Variogram — Μια μέτρηση της ανομοιότητας έναντι της απόστασης. Υπολογίζεται ως το μισό της μέσης τετραγωνικής διαφοράς των τιμών που χωρίζονται από ένα διάνυσμα χωρικής υστέρησης.

Ένα μέτρο του πόσο αλλάζει η μεταβλητή σας σε απόσταση.