Τι πληροφορίες μπορούμε να αποκτήσουμε χρησιμοποιώντας το ETL και το BI;

Πίνακας περιεχομένων

Εισαγωγή
Δήλωση προβλήματος
Δεδομένα
Αρχιτεκτονική AWS
Αποθήκευση δεδομένων με AWS S3
Σχεδιασμός του Σχήμα
ETL με κόλλα AWS
Αποθήκευση δεδομένων με AWS Redshift
Εξαγωγή πληροφοριών με το AWS Redshift
Οπτικοποίηση δεδομένων με το Power BI< br /> ∘ Μελλοντικά Βήματα
Συμπέρασμα
Αναφορές

Εισαγωγή

Τα αεροπορικά ταξίδια έχουν γίνει αναπόσπαστο μέρος της ζωής μας. Είναι ένα μέσο για τις επιχειρήσεις να δικτυωθούν και να διεξάγουν εμπόριο και για τις οικογένειες να επισκεφτούν αγαπημένα πρόσωπα ή να ταξιδέψουν.

Παρά την επιρροή της, ο κλάδος των αερομεταφορών είναι γνωστός ότι αντιμετωπίζει αναταράξεις. Υπόκειται σε συνεχείς αλλαγές λόγω εξωτερικών παραγόντων όπως η οικονομική κατάρρευση και η άνθηση, η κλιματική αλλαγή, η πανδημία Covid-19 και η ώθηση να βασιστούμε περισσότερο στις ανανεώσιμες πηγές ενέργειας.

Για να γνωρίζετε τέτοιες αλλαγές και τον αντίκτυπό τους στα αεροπορικά ταξίδια, αξίζει να παρακολουθείτε αυτές τις πτήσεις με την πάροδο του χρόνου. Μια τέτοια προσπάθεια απαιτεί μια ισχυρή στρατηγική για την αποθήκευση δεδομένων, την ανάλυση δεδομένων και την οπτικοποίηση δεδομένων.

Δήλωση προβλήματος

Αυτό το έργο έχει 2 πρωταρχικούς στόχους. Το πρώτο είναι να χρησιμοποιηθούν οι πόροι που παρέχονται από τις Υπηρεσίες Ιστού της Amazon (AWS) για τη δημιουργία ενός αγωγού δεδομένων που διευκολύνει την αποθήκευση, τον μετασχηματισμό και την ανάλυση των δεδομένων πτήσης των ΗΠΑ.

Το δεύτερο είναι να δημιουργήσετε ένα εργαλείο οπτικοποίησης με το Power BI που μπορεί να απεικονίσει αποτελεσματικά τα βασικά ευρήματα από τα δεδομένα.

Δεδομένα

Το σύνολο δεδομένων που χρησιμοποιήθηκε για αυτό το έργο λαμβάνεται από το Γραφείο Στατιστικών Μεταφορών. Αναφέρει κυρίως τον αριθμό των συνολικών πτήσεων, καθυστερήσεων και ακυρώσεων σε αεροδρόμια και αερομεταφορείς από το 2003 έως το 2023.

Ακολουθεί μια προεπισκόπηση του συνόλου δεδομένων: