OLAP στην οικονομική διαχείριση. Τεχνολογία OLAP Εφαρμογή olap

26.02.2022

Η έννοια της πολυδιάστατης ανάλυσης δεδομένων συνδέεται στενά με τη λειτουργική ανάλυση, η οποία εκτελείται με τη χρήση συστημάτων OLAP.

Το OLAP (On-Line Analytical Processing) είναι μια τεχνολογία για επιχειρησιακή αναλυτική επεξεργασία δεδομένων που χρησιμοποιεί μεθόδους και εργαλεία για τη συλλογή, αποθήκευση και ανάλυση πολυδιάστατων δεδομένων για την υποστήριξη διαδικασιών λήψης αποφάσεων.

Ο κύριος σκοπός των συστημάτων OLAP είναι να υποστηρίζουν αναλυτικές δραστηριότητες και αυθαίρετα (συχνά χρησιμοποιείται ο όρος ad-hoc) αιτήματα από αναλυτές χρηστών. Ο σκοπός της ανάλυσης OLAP είναι να ελέγξει τις αναδυόμενες υποθέσεις.

Στην απαρχή της τεχνολογίας OLAP είναι ο ιδρυτής της σχεσιακής προσέγγισης, ο E. Codd. Το 1993, δημοσίευσε ένα άρθρο με τίτλο «OLAP για αναλυτές χρηστών: Τι πρέπει να είναι». Αυτό το έγγραφο περιγράφει τις βασικές έννοιες των διαδικτυακών αναλυτικών στοιχείων και προσδιορίζει τις ακόλουθες 12 απαιτήσεις που πρέπει να πληρούν τα προϊόντα που επιτρέπουν την ηλεκτρονική ανάλυση. Tokmakov G.P. Βάση δεδομένων. Έννοια βάσης δεδομένων, μοντέλο σχεσιακών δεδομένων, Γλώσσες SQL. Σελ. 51

Παρακάτω παρατίθενται οι 12 κανόνες που περιγράφονται από τον Codd που ορίζουν το OLAP.

1. Πολυδιάσταση -- ένα σύστημα OLAP σε εννοιολογικό επίπεδο θα πρέπει να παρουσιάζει δεδομένα με τη μορφή πολυδιάστατου μοντέλου, το οποίο απλοποιεί τις διαδικασίες ανάλυσης και αντίληψης πληροφοριών.

2. Διαφάνεια -- το σύστημα OLAP πρέπει να κρύβει από τον χρήστη την πραγματική υλοποίηση του πολυδιάστατου μοντέλου, τη μέθοδο οργάνωσης, τις πηγές, τα μέσα επεξεργασίας και αποθήκευσης.

3. Διαθεσιμότητα -- Ένα σύστημα OLAP πρέπει να παρέχει στο χρήστη ένα ενιαίο, συνεπές και ολιστικό μοντέλο δεδομένων, παρέχοντας πρόσβαση στα δεδομένα ανεξάρτητα από τον τρόπο ή τον τόπο αποθήκευσης τους.

4. Συνεπής απόδοση κατά την ανάπτυξη αναφορών - η απόδοση των συστημάτων OLAP δεν πρέπει να μειώνεται σημαντικά καθώς αυξάνεται ο αριθμός των διαστάσεων στις οποίες εκτελείται η ανάλυση.

5. Αρχιτεκτονική πελάτη-διακομιστή -- το σύστημα OLAP πρέπει να μπορεί να λειτουργεί σε περιβάλλον πελάτη-διακομιστή, επειδή Τα περισσότερα από τα δεδομένα που σήμερα πρέπει να υποβληθούν σε επιχειρησιακή αναλυτική επεξεργασία αποθηκεύονται κατανεμημένα. Η κύρια ιδέα εδώ είναι ότι το στοιχείο διακομιστή του εργαλείου OLAP θα πρέπει να είναι αρκετά έξυπνο και να επιτρέπει την κατασκευή ενός κοινού εννοιολογικού σχήματος βασισμένου στη γενίκευση και ενοποίηση διαφόρων λογικών και φυσικών σχημάτων εταιρικών βάσεων δεδομένων για να παρέχει το αποτέλεσμα της διαφάνειας.

6. Ισότητα διαστάσεων -- Το σύστημα OLAP πρέπει να υποστηρίζει ένα πολυδιάστατο μοντέλο στο οποίο όλες οι διαστάσεις είναι ίσες. Αν είναι απαραίτητο πρόσθετα χαρακτηριστικάμπορεί να δοθεί σε μεμονωμένες διαστάσεις, αλλά αυτή η δυνατότητα πρέπει να δοθεί σε οποιαδήποτε διάσταση.

7. Δυναμική διαχείριση αραιών πινάκων -- το σύστημα OLAP πρέπει να παρέχει τη βέλτιστη επεξεργασία των αραιών πινάκων. Η ταχύτητα πρόσβασης πρέπει να διατηρείται ανεξάρτητα από τη θέση των κελιών δεδομένων και να είναι σταθερή για μοντέλα με διαφορετικούς αριθμούς διαστάσεων και διαφορετικούς βαθμούς αραιότητας δεδομένων.

8. Υποστήριξη για λειτουργία πολλών χρηστών - το σύστημα OLAP πρέπει να παρέχει τη δυνατότητα σε πολλούς χρήστες να συνεργάζονται με ένα αναλυτικό μοντέλο ή να δημιουργούν διαφορετικά μοντέλα για αυτούς από μεμονωμένα δεδομένα. Σε αυτήν την περίπτωση, είναι δυνατή τόσο η ανάγνωση όσο και η εγγραφή δεδομένων, επομένως το σύστημα πρέπει να διασφαλίζει την ακεραιότητα και την ασφάλειά τους.

9. Απεριόριστες διασταυρούμενες λειτουργίες -- το σύστημα OLAP πρέπει να διασφαλίζει ότι οι λειτουργικές σχέσεις που περιγράφονται χρησιμοποιώντας μια συγκεκριμένη επίσημη γλώσσα μεταξύ των κελιών του υπερκύβου διατηρούνται κατά την εκτέλεση οποιωνδήποτε λειτουργιών κοπής, περιστροφής, ενοποίησης ή διάτρησης. Το σύστημα θα πρέπει να πραγματοποιεί ανεξάρτητα (αυτόματα) τον μετασχηματισμό των καθιερωμένων σχέσεων, χωρίς να απαιτεί από τον χρήστη να τις επαναπροσδιορίσει.

10. Διαισθητικός χειρισμός δεδομένων -- Ένα σύστημα OLAP πρέπει να παρέχει έναν τρόπο εκτέλεσης εργασιών τεμαχισμού, περιστροφής, ενοποίησης και διάτρησης σε έναν υπερκύβο χωρίς ο χρήστης να χρειάζεται να κάνει πολλούς χειρισμούς διεπαφής. Οι διαστάσεις που ορίζονται στο αναλυτικό μοντέλο πρέπει να περιέχουν όλες τις απαραίτητες πληροφορίες για την εκτέλεση των παραπάνω πράξεων.

11. Ευέλικτες επιλογές για τη λήψη αναφορών -- το σύστημα OLAP πρέπει να υποστηρίζει διάφορες μεθόδους οπτικοποίησης δεδομένων, π.χ. Οι εκθέσεις θα πρέπει να παρουσιάζονται με οποιονδήποτε πιθανό προσανατολισμό. Τα εργαλεία αναφοράς πρέπει να παρουσιάζουν συνθετικά δεδομένα ή πληροφορίες που προκύπτουν από το μοντέλο δεδομένων με οποιονδήποτε πιθανό προσανατολισμό. Αυτό σημαίνει ότι οι σειρές, οι στήλες ή οι σελίδες πρέπει να εμφανίζουν διαστάσεις 0 έως N κάθε φορά, όπου Ν-- αριθμόςμετρήσεις ολόκληρου του αναλυτικού μοντέλου. Επιπλέον, κάθε ιδιότητα περιεχομένου που εμφανίζεται σε μία ανάρτηση, στήλη ή σελίδα πρέπει να επιτρέπει σε οποιοδήποτε υποσύνολο των στοιχείων (τιμών) που περιέχονται στην ιδιότητα να εμφανίζονται με οποιαδήποτε σειρά.

12. Απεριόριστη διάσταση και αριθμός επιπέδων συγκέντρωσης - έρευνα σχετικά με τον πιθανό αριθμό των απαραίτητων διαστάσεων που απαιτούνται στο αναλυτικό μοντέλο έδειξε ότι έως και 19 διαστάσεις μπορούν να χρησιμοποιηθούν ταυτόχρονα. Ως εκ τούτου, συνιστάται έντονα το αναλυτικό εργαλείο να μπορεί να παρέχει τουλάχιστον 15, και κατά προτίμηση 20, μετρήσεις ταυτόχρονα. Επιπλέον, καθεμία από τις κοινές διαστάσεις δεν πρέπει να περιορίζεται στον αριθμό των επιπέδων συγκέντρωσης και των διαδρομών ενοποίησης που καθορίζονται από τον αναλυτή.

Πρόσθετοι κανόνες του Codd.

Το σύνολο αυτών των απαιτήσεων, το οποίο χρησίμευσε ως ο de facto ορισμός του OLAP, προκαλεί αρκετά συχνά διάφορα παράπονα, για παράδειγμα, οι κανόνες 1, 2, 3, 6 είναι απαιτήσεις και οι κανόνες 10, 11 είναι ανεπίσημες επιθυμίες. Tokmakov G.P. Βάση δεδομένων. Έννοια βάσης δεδομένων, μοντέλο σχεσιακών δεδομένων, γλώσσες SQL. Σελ. 68 Έτσι, οι 12 απαιτήσεις του Codd που απαριθμούνται δεν μας επιτρέπουν να ορίσουμε με ακρίβεια το OLAP. Το 1995, ο Codd πρόσθεσε τους ακόλουθους έξι κανόνες στην παραπάνω λίστα:

13. Ανάκτηση παρτίδας έναντι ερμηνείας -- Ένα σύστημα OLAP πρέπει να παρέχει πρόσβαση τόσο στα δικά του όσο και στα εξωτερικά δεδομένα εξίσου αποτελεσματικά.

14. Υποστήριξη για όλα τα μοντέλα ανάλυσης OLAP -- Ένα σύστημα OLAP πρέπει να υποστηρίζει και τα τέσσερα μοντέλα ανάλυσης δεδομένων που ορίζονται από τον Codd: κατηγορηματικά, ερμηνευτικά, εικαστικά και στερεότυπα.

15. Επεξεργασία μη κανονικοποιημένων δεδομένων -- το σύστημα OLAP πρέπει να είναι ενσωματωμένο με μη κανονικοποιημένες πηγές δεδομένων. Οι τροποποιήσεις δεδομένων που γίνονται στο περιβάλλον OLAP δεν θα πρέπει να έχουν ως αποτέλεσμα αλλαγές στα δεδομένα που είναι αποθηκευμένα στα αρχικά εξωτερικά συστήματα.

16. Αποθήκευση αποτελεσμάτων OLAP: αποθήκευση τους χωριστά από τα δεδομένα προέλευσης - ένα σύστημα OLAP που λειτουργεί σε λειτουργία ανάγνωσης-εγγραφής πρέπει να αποθηκεύει τα αποτελέσματα ξεχωριστά μετά την τροποποίηση των δεδομένων προέλευσης. Με άλλα λόγια, διασφαλίζεται η ασφάλεια των αρχικών δεδομένων.

17. Εξάλειψη των τιμών που λείπουν - Ένα σύστημα OLAP, όταν παρουσιάζει δεδομένα στον χρήστη, πρέπει να απορρίψει όλες τις τιμές που λείπουν. Με άλλα λόγια, οι τιμές που λείπουν πρέπει να είναι διαφορετικές από τις μηδενικές τιμές.

18. Χειρισμός τιμών που λείπουν -- Το σύστημα OLAP πρέπει να αγνοεί όλες τις τιμές που λείπουν, ανεξάρτητα από την πηγή τους. Αυτό το χαρακτηριστικό σχετίζεται με τον 17ο κανόνα.

Επιπλέον, ο Codd χώρισε και τους 18 κανόνες στις ακόλουθες τέσσερις ομάδες, αποκαλώντας τους χαρακτηριστικά. Αυτές οι ομάδες ονομάστηκαν B, S, R και D.

Τα κύρια χαρακτηριστικά του (Β) περιλαμβάνουν τους ακόλουθους κανόνες:

Πολυδιάστατη εννοιολογική αναπαράσταση δεδομένων (κανόνας 1).

Διαισθητικός χειρισμός δεδομένων (κανόνας 10).

Διαθεσιμότητα (κανόνας 3).

Εξαγωγή παρτίδας έναντι ερμηνείας (κανόνας 13).

Υποστήριξη για όλα τα μοντέλα ανάλυσης OLAP (κανόνας 14).

Αρχιτεκτονική πελάτη-διακομιστή (κανόνας 5).

Διαφάνεια (κανόνας 2).

Υποστήριξη πολλών χρηστών (κανόνας 8)

Ειδικά Χαρακτηριστικά (S):

Επεξεργασία μη κανονικοποιημένων δεδομένων (κανόνας 15).

Αποθήκευση αποτελεσμάτων OLAP: αποθήκευση τους χωριστά από τα δεδομένα προέλευσης (κανόνας 16).

Εξάλειψη των τιμών που λείπουν (κανόνας 17).

Χειρισμός τιμών που λείπουν (κανόνας 18). Λειτουργίες αναφοράς (R):

Ευελιξία στην υποβολή εκθέσεων (κανόνας 11).

Τυπική απόδοση αναφοράς (κανόνας 4).

Αυτόματη διαμόρφωση φυσικού επιπέδου (τροποποιημένος αρχικός κανόνας 7).

Έλεγχος διαστάσεων (D):

Καθολικότητα των μετρήσεων (κανόνας 6).

Απεριόριστος αριθμός διαστάσεων και επιπέδων συγκέντρωσης (κανόνας 12).

Απεριόριστες λειτουργίες μεταξύ των διαστάσεων (κανόνας 9).

Η έννοια της τεχνολογίας OLAP διατυπώθηκε από τον Edgar Codd το 1993.

Αυτή η τεχνολογία βασίζεται στην κατασκευή πολυδιάστατων συνόλων δεδομένων - τους λεγόμενους κύβους OLAP (όχι απαραίτητα τρισδιάστατους, όπως θα μπορούσε να συμπεράνει κανείς από τον ορισμό). Ο σκοπός της χρήσης τεχνολογιών OLAP είναι η ανάλυση δεδομένων και η παρουσίαση αυτής της ανάλυσης σε μια μορφή κατάλληλη για το διοικητικό προσωπικό να κατανοήσει και να λάβει αποφάσεις με βάση αυτά.

Βασικές απαιτήσεις για εφαρμογές πολυμεταβλητής ανάλυσης:

  • - παροχή στον χρήστη των αποτελεσμάτων ανάλυσης σε αποδεκτό χρόνο (όχι περισσότερο από 5 δευτερόλεπτα).
  • - πρόσβαση πολλών χρηστών σε δεδομένα.
  • - πολυδιάστατη παρουσίαση δεδομένων.
  • - τη δυνατότητα πρόσβασης σε οποιαδήποτε πληροφορία ανεξάρτητα από την τοποθεσία αποθήκευσης και τον όγκο τους.

Τα εργαλεία συστήματος OLAP παρέχουν τη δυνατότητα ταξινόμησης και επιλογής δεδομένων σύμφωνα με καθορισμένες συνθήκες. Μπορούν να καθοριστούν διάφορες ποιοτικές και ποσοτικές συνθήκες.

Το κύριο μοντέλο δεδομένων που χρησιμοποιείται σε πολλά εργαλεία για τη δημιουργία και τη διατήρηση βάσεων δεδομένων - DBMS - είναι το σχεσιακό μοντέλο. Τα δεδομένα σε αυτό παρουσιάζονται με τη μορφή ενός συνόλου δισδιάστατων πινάκων σχέσεων που συνδέονται με βασικά πεδία. Για την εξάλειψη των επικαλύψεων, της ασυνέπειας και τη μείωση του κόστους εργασίας για τη διατήρηση βάσεων δεδομένων, χρησιμοποιείται μια επίσημη συσκευή για την κανονικοποίηση των πινάκων οντοτήτων. Ωστόσο, η χρήση του σχετίζεται με πρόσθετο χρόνο που αφιερώνεται για τη δημιουργία απαντήσεων σε ερωτήματα βάσης δεδομένων, αν και οι πόροι μνήμης αποθηκεύονται.

Ένα πολυδιάστατο μοντέλο δεδομένων αντιπροσωπεύει το υπό μελέτη αντικείμενο με τη μορφή ενός πολυδιάστατου κύβου που χρησιμοποιείται συχνότερα. Οι διαστάσεις ή οι λεπτομέρειες χαρακτηριστικών σχεδιάζονται κατά μήκος των αξόνων ή των όψεων του κύβου. Τα βασικά χαρακτηριστικά είναι η πλήρωση των κυψελών του κύβου. Ένας πολυδιάστατος κύβος μπορεί να αναπαρασταθεί από έναν συνδυασμό τρισδιάστατων κύβων προκειμένου να διευκολυνθεί η αντίληψη και η παρουσίαση κατά τη δημιουργία αναφορών και αναλυτικών εγγράφων και παρουσιάσεων πολυμέσων με βάση αναλυτικό υλικό εργασίας σε ένα σύστημα υποστήριξης αποφάσεων.

Στο πλαίσιο των τεχνολογιών OLAP, με βάση το γεγονός ότι μια πολυδιάστατη αναπαράσταση δεδομένων μπορεί να οργανωθεί τόσο με σχεσιακά DBMS όσο και με πολυδιάστατα εξειδικευμένα εργαλεία, διακρίνονται τρεις τύποι πολυδιάστατων συστημάτων OLAP:

  • - πολυδιάστατο OLAP-MOLAP.
  • - σχεσιακό OLAP-ROLAP.
  • - μικτό ή υβριδικό (Hibrid) OLAP-HOLAP.

Στα πολυδιάστατα DBMS, τα δεδομένα οργανώνονται όχι με τη μορφή σχεσιακών πινάκων, αλλά με τη μορφή διατεταγμένων πολυδιάστατων πινάκων με τη μορφή υπερκύβων, όταν όλα τα αποθηκευμένα δεδομένα πρέπει να έχουν την ίδια διάσταση, πράγμα που σημαίνει την ανάγκη να σχηματιστεί η μέγιστη πλήρης βάσηΜετρήσεις. Τα δεδομένα μπορούν να οργανωθούν με τη μορφή πολυκύβων σε αυτήν την επιλογή, οι τιμές κάθε δείκτη αποθηκεύονται με το δικό του σύνολο διαστάσεων και η επεξεργασία δεδομένων πραγματοποιείται από το ίδιο το εργαλείο του συστήματος. Η δομή αποθήκευσης σε αυτή την περίπτωση είναι απλοποιημένη, επειδή δεν υπάρχει ανάγκη για χώρο αποθήκευσης δεδομένων σε πολυδιάστατη ή αντικειμενοστραφή μορφή. Το τεράστιο κόστος εργασίας για τη δημιουργία μοντέλων και συστημάτων για τη μετατροπή δεδομένων από ένα σχεσιακό μοντέλο σε ένα μοντέλο αντικειμένου μειώνεται.

Τα πλεονεκτήματα του MOLAP είναι:

  • - ταχύτερη λήψη απαντήσεων σε αιτήματα από ό,τι με το ROLAP - ο χρόνος που δαπανάται είναι κατά μία ή δύο τάξεις μεγέθους μικρότερος.
  • - Οι περιορισμοί SQL καθιστούν δύσκολη την υλοποίηση πολλών ενσωματωμένων λειτουργιών.

Οι περιορισμοί του MOLAP περιλαμβάνουν:

  • - σχετικά μικρά μεγέθη βάσης δεδομένων.
  • - λόγω αποκανονικοποίησης και προ-συσσωμάτωσης πολυδιάστατους πίνακεςχρησιμοποιήστε 2,5-100 φορές περισσότερη μνήμη από τα αρχικά δεδομένα (η κατανάλωση μνήμης αυξάνεται εκθετικά καθώς αυξάνεται ο αριθμός των μετρήσεων).
  • - δεν υπάρχουν πρότυπα για τη διεπαφή και τα μέσα χειρισμού δεδομένων.
  • - υπάρχουν περιορισμοί κατά τη φόρτωση δεδομένων.

Το κόστος εργασίας για τη δημιουργία πολυδιάστατων δεδομένων αυξάνεται απότομα, επειδή... Σε αυτήν την περίπτωση, δεν υπάρχουν πρακτικά εξειδικευμένα μέσα αντικειμενοποίησης του σχεσιακού μοντέλου δεδομένων που περιέχονται στο αποθετήριο πληροφοριών. Οι χρόνοι απόκρισης ερωτημάτων συχνά δεν μπορούν να ικανοποιήσουν τις απαιτήσεις για συστήματα OLAP.

Τα πλεονεκτήματα των συστημάτων ROLAP είναι:

  • - τη δυνατότητα γρήγορης ανάλυσης των δεδομένων που περιέχονται απευθείας στην αποθήκη, επειδή Οι περισσότερες από τις βάσεις δεδομένων πηγής είναι σχεσιακές.
  • - με μεταβλητή διάσταση του προβλήματος, το RO-LAP κερδίζει, γιατί δεν απαιτείται φυσική αναδιοργάνωση της βάσης δεδομένων.
  • - Τα συστήματα ROLAP μπορούν να χρησιμοποιούν λιγότερο ισχυρούς σταθμούς πελατών και διακομιστές και οι διακομιστές φέρουν το κύριο βάρος της επεξεργασίας πολύπλοκων ερωτημάτων SQL.
  • - το επίπεδο προστασίας πληροφοριών και διαφοροποίησης των δικαιωμάτων πρόσβασης στα σχεσιακά ΣΔΒΔ είναι ασύγκριτα υψηλότερο από ό,τι στα πολυδιάστατα.

Το μειονέκτημα των συστημάτων ROLAP είναι η χαμηλότερη παραγωγικότητα, η ανάγκη για προσεκτική ανάπτυξη σχημάτων βάσεων δεδομένων, ειδικός συντονισμός ευρετηρίων, ανάλυση στατιστικών ερωτημάτων και συνυπολογισμός ευρημάτων ανάλυσης κατά την τροποποίηση σχημάτων βάσεων δεδομένων, γεγονός που οδηγεί σε σημαντικό πρόσθετο κόστος εργασίας.

Η εκπλήρωση αυτών των προϋποθέσεων επιτρέπει, όταν χρησιμοποιούνται συστήματα ROLAP, να επιτυγχάνονται δείκτες παρόμοιοι με τα συστήματα MOLAP όσον αφορά τον χρόνο πρόσβασης, καθώς και να τους ξεπερνούν σε εξοικονόμηση μνήμης.

Τα υβριδικά συστήματα OLAP είναι ένας συνδυασμός εργαλείων που υλοποιούν ένα σχεσιακό και πολυδιάστατο μοντέλο δεδομένων. Αυτό σας επιτρέπει να μειώσετε δραματικά το κόστος των πόρων για τη δημιουργία και τη διατήρηση ενός τέτοιου μοντέλου και τον χρόνο απόκρισης στα αιτήματα.

Αυτή η προσέγγιση χρησιμοποιεί τα πλεονεκτήματα των δύο πρώτων προσεγγίσεων και αντισταθμίζει τα μειονεκτήματά τους. Στα πιο ανεπτυγμένα προϊόντα λογισμικούΓια το σκοπό αυτό εφαρμόζεται αυτή η αρχή.

Η χρήση της υβριδικής αρχιτεκτονικής σε συστήματα OLAP είναι ο καταλληλότερος τρόπος επίλυσης προβλημάτων που σχετίζονται με τη χρήση εργαλείων λογισμικού στην πολυδιάστατη ανάλυση.

Η λειτουργία ανίχνευσης προτύπων βασίζεται στην έξυπνη επεξεργασία δεδομένων. Το κύριο καθήκον εδώ είναι ο εντοπισμός προτύπων στις υπό μελέτη διαδικασίες, οι σχέσεις και η αμοιβαία επιρροή διαφόρων παραγόντων, η αναζήτηση μεγάλων «ασυνήθιστων» αποκλίσεων και η πρόβλεψη της πορείας διαφόρων σημαντικών διαδικασιών. Αυτός ο τομέας σχετίζεται με την εξόρυξη δεδομένων.

Ο μηχανισμός OLAP είναι μια από τις δημοφιλείς μεθόδους ανάλυσης δεδομένων σήμερα. Υπάρχουν δύο κύριες προσεγγίσεις για την επίλυση αυτού του προβλήματος. Το πρώτο από αυτά ονομάζεται Multidimensional OLAP (MOLAP) - υλοποίηση του μηχανισμού χρησιμοποιώντας μια πολυδιάστατη βάση δεδομένων στην πλευρά του διακομιστή και το δεύτερο Relational OLAP (ROLAP) - δημιουργία κύβων εν κινήσει με βάση Ερωτήματα SQLσε ένα σχεσιακό DBMS. Κάθε μία από αυτές τις προσεγγίσεις έχει τα υπέρ και τα κατά της. Δικα τους συγκριτική ανάλυσηείναι εκτός του πεδίου εφαρμογής αυτού του άρθρου. Θα περιγράψουμε την υλοποίηση του πυρήνα της μονάδας ROLAP για επιτραπέζιους υπολογιστές.

Αυτή η εργασία προέκυψε μετά τη χρήση ενός συστήματος ROLAP που δημιουργήθηκε με βάση τα στοιχεία του κύβου απόφασης που περιλαμβάνονται στο Borland Delphi. Δυστυχώς, η χρήση αυτού του συνόλου στοιχείων έδειξε κακή απόδοση σε μεγάλους όγκους δεδομένων. Αυτό το πρόβλημα μπορεί να μετριαστεί προσπαθώντας να αποκόψετε όσο το δυνατόν περισσότερα δεδομένα πριν τα τροφοδοτήσετε σε κύβους. Αλλά αυτό δεν είναι πάντα αρκετό.

Μπορείτε να βρείτε πολλές πληροφορίες για τα συστήματα OLAP στο Διαδίκτυο και στον Τύπο, αλλά σχεδόν πουθενά δεν αναφέρεται πώς λειτουργεί στο εσωτερικό του. Επομένως, η λύση στα περισσότερα προβλήματα μας δόθηκε με δοκιμή και λάθος.

Σχέδιο εργασίας

Το γενικό σχήμα λειτουργίας ενός επιτραπέζιου συστήματος OLAP μπορεί να αναπαρασταθεί ως εξής:

Ο αλγόριθμος λειτουργίας είναι ο εξής:

  1. Λήψη δεδομένων με τη μορφή ενός επίπεδου πίνακα ή ως αποτέλεσμα της εκτέλεσης ενός ερωτήματος SQL.
  2. Αποθήκευση δεδομένων στην κρυφή μνήμη και μετατροπή τους σε πολυδιάστατο κύβο.
  3. Εμφάνιση του κατασκευασμένου κύβου με χρήση καρτέλας ή γραφήματος κ.λπ. Γενικά, ένας αυθαίρετος αριθμός προβολών μπορεί να συνδεθεί σε έναν κύβο.

Ας εξετάσουμε πώς παρόμοιο σύστημαμπορεί να τακτοποιηθεί στο εσωτερικό. Θα ξεκινήσουμε από την πλευρά που φαίνεται και αγγίζεται, δηλαδή από τις οθόνες.

Οι οθόνες που χρησιμοποιούνται στα συστήματα OLAP συνήθως διατίθενται σε δύο τύπους: cross-tabs και γραφήματα. Ας δούμε μια διασταύρωση, η οποία είναι ο βασικός και πιο συνηθισμένος τρόπος εμφάνισης ενός κύβου.

Σταυρός τραπέζι

Στο παρακάτω σχήμα, οι σειρές και οι στήλες που περιέχουν συγκεντρωτικά αποτελέσματα εμφανίζονται με κίτρινο χρώμα, τα κελιά που περιέχουν στοιχεία είναι με ανοιχτό γκρι και τα κελιά που περιέχουν δεδομένα διαστάσεων είναι με σκούρο γκρι.

Έτσι, ο πίνακας μπορεί να χωριστεί στα ακόλουθα στοιχεία, με τα οποία θα εργαστούμε στο μέλλον:

Όταν συμπληρώνουμε τον πίνακα με γεγονότα, πρέπει να προχωρήσουμε ως εξής:

  • Με βάση τα δεδομένα μέτρησης, προσδιορίστε τις συντεταγμένες του στοιχείου που θα προστεθεί στον πίνακα.
  • Προσδιορίστε τις συντεταγμένες των στηλών και των γραμμών των συνόλων που επηρεάζονται από το προστιθέμενο στοιχείο.
  • Προσθέστε ένα στοιχείο στον πίνακα και τις αντίστοιχες συνολικές στήλες και γραμμές.

Θα πρέπει να σημειωθεί ότι η μήτρα που θα προκύψει θα είναι πολύ αραιή, γι' αυτό και η οργάνωσή της με τη μορφή δισδιάστατου πίνακα (η επιλογή που βρίσκεται στην επιφάνεια) είναι όχι μόνο παράλογη, αλλά, πιθανότατα, αδύνατη λόγω του μεγάλου διάσταση αυτού του πίνακα, για την αποθήκευση του οποίου δεν υπάρχει όγκος είναι αρκετός μνήμη τυχαίας προσπέλασης. Για παράδειγμα, εάν ο κύβος μας περιέχει πληροφορίες σχετικά με τις πωλήσεις για ένα έτος και εάν έχει μόνο 3 διαστάσεις - Πελάτες (250), Προϊόντα (500) και Ημερομηνία (365), τότε θα λάβουμε έναν πίνακα γεγονότων με τις ακόλουθες διαστάσεις:

Αριθμός στοιχείων = 250 x 500 x 365 = 45.625.000

Και αυτό παρά το γεγονός ότι μπορεί να υπάρχουν μόνο μερικές χιλιάδες γεμάτα στοιχεία στη μήτρα. Επιπλέον, όσο μεγαλύτερος είναι ο αριθμός των διαστάσεων, τόσο πιο αραιός θα είναι ο πίνακας.

Επομένως, για να εργαστείτε με αυτόν τον πίνακα, πρέπει να χρησιμοποιήσετε ειδικούς μηχανισμούς για εργασία με αραιούς πίνακες. Είναι δυνατές διάφορες επιλογές για την οργάνωση μιας αραιής μήτρας. Περιγράφονται αρκετά καλά στη βιβλιογραφία προγραμματισμού, για παράδειγμα, στον πρώτο τόμο του κλασικού βιβλίου "The Art of Programming" του Donald Knuth.

Ας εξετάσουμε τώρα πώς μπορούμε να προσδιορίσουμε τις συντεταγμένες ενός γεγονότος, γνωρίζοντας τις διαστάσεις που αντιστοιχούν σε αυτό. Για να γίνει αυτό, ας ρίξουμε μια πιο προσεκτική ματιά στη δομή της κεφαλίδας:

Σε αυτήν την περίπτωση, μπορείτε εύκολα να βρείτε έναν τρόπο να προσδιορίσετε τους αριθμούς του αντίστοιχου κελιού και τα σύνολα στα οποία εμπίπτει. Εδώ μπορούν να προταθούν διάφορες προσεγγίσεις. Ένα από αυτά είναι να χρησιμοποιήσετε ένα δέντρο για να βρείτε τα αντίστοιχα κελιά. Αυτό το δέντρο μπορεί να κατασκευαστεί διασχίζοντας την επιλογή. Επιπλέον, ένας αναλυτικός τύπος επανάληψης μπορεί εύκολα να οριστεί για τον υπολογισμό της απαιτούμενης συντεταγμένης.

Προετοιμασία δεδομένων

Τα δεδομένα που είναι αποθηκευμένα στον πίνακα πρέπει να μετασχηματιστούν για να χρησιμοποιηθούν. Έτσι, για να βελτιωθεί η απόδοση κατά την κατασκευή ενός υπερκύβου, είναι επιθυμητό να βρεθούν μοναδικά στοιχεία αποθηκευμένα σε στήλες που έχουν διαστάσεις του κύβου. Επιπλέον, μπορείτε να πραγματοποιήσετε προκαταρκτική συγκέντρωση γεγονότων για εγγραφές που έχουν τις ίδιες τιμές διαστάσεων. Όπως αναφέρθηκε παραπάνω, οι μοναδικές τιμές που είναι διαθέσιμες στα πεδία μέτρησης είναι σημαντικές για εμάς. Στη συνέχεια μπορεί να προταθεί η ακόλουθη δομή για την αποθήκευσή τους:

Χρησιμοποιώντας αυτή τη δομή, μειώνουμε σημαντικά την απαίτηση μνήμης. Κάτι που είναι αρκετά σχετικό, γιατί... Για να αυξήσετε την ταχύτητα λειτουργίας, συνιστάται η αποθήκευση δεδομένων στη μνήμη RAM. Επιπλέον, μπορείτε να αποθηκεύσετε μόνο μια σειρά στοιχείων και να αποθέσετε τις τιμές τους στο δίσκο, καθώς θα τα χρειαστούμε μόνο όταν εμφανίζουμε τη διασταύρωση.

CubeBase Component Library

Οι ιδέες που περιγράφονται παραπάνω ήταν η βάση για τη δημιουργία της βιβλιοθήκης στοιχείων CubeBase.

TCubeSourceπραγματοποιεί προσωρινή αποθήκευση και μετατροπή δεδομένων σε εσωτερική μορφή, καθώς και προκαταρκτική συγκέντρωση δεδομένων. Συστατικό TCubeEngineπραγματοποιεί υπολογισμούς του υπερκύβου και πράξεις με αυτόν. Στην πραγματικότητα, είναι μια μηχανή OLAP που μετατρέπει ένα επίπεδο τραπέζι σε ένα πολυδιάστατο σύνολο δεδομένων. Συστατικό TCubeGridεμφανίζει τη διασταύρωση και ελέγχει την εμφάνιση του υπερκύβου. TCCubeChartσας επιτρέπει να δείτε τον υπερκύβο με τη μορφή γραφημάτων και το στοιχείο TCubePivoteελέγχει τη λειτουργία του πυρήνα του κύβου.

Σύγκριση απόδοσης

Αυτό το σύνολο εξαρτημάτων έδειξε πολύ υψηλότερη απόδοση από το Decision Cube. Έτσι, σε ένα σύνολο 45 χιλιάδων εγγραφών, τα στοιχεία του κύβου απόφασης απαιτούσαν 8 λεπτά. για την κατασκευή ενός πίνακα περιστροφής. Το CubeBase φόρτωσε δεδομένα σε 7 δευτερόλεπτα. και κατασκευή ενός πίνακα περιστροφής σε 4 δευτερόλεπτα. Κατά τη δοκιμή σε 700 χιλιάδες εγγραφές του κύβου απόφασης, δεν λάβαμε απάντηση εντός 30 λεπτών, μετά την οποία ακυρώσαμε την εργασία. Το CubeBase φόρτωσε δεδομένα σε 45 δευτερόλεπτα. και χτίζοντας έναν κύβο σε 15 δευτερόλεπτα.

Σε όγκους δεδομένων χιλιάδων εγγραφών, το CubeBase επεξεργάστηκε δεκάδες φορές πιο γρήγορα από το Decision Cube. Σε τραπέζια με εκατοντάδες χιλιάδες δίσκους - εκατοντάδες φορές πιο γρήγορα. Και η υψηλή απόδοση είναι ένας από τους πιο σημαντικούς δείκτες των συστημάτων OLAP.

Σκοπός της έκθεσης

Αυτή η έκθεση θα επικεντρωθεί σε μία από τις κατηγορίες ευφυών τεχνολογιών που αποτελούν ένα βολικό εργαλείο ανάλυσης - τις τεχνολογίες OLAP.

Σκοπός της έκθεσης: να αποκαλύψει και να επισημάνει 2 θέματα: 1) την έννοια του OLAP και την εφαρμοσμένη σημασία τους στη δημοσιονομική διαχείριση. 2) υλοποίηση της λειτουργικότητας OLAP σε λύσεις λογισμικού: διαφορές, ευκαιρίες, πλεονεκτήματα, μειονεκτήματα.

Θα ήθελα να σημειώσω αμέσως ότι το OLAP είναι ένα καθολικό εργαλείο που μπορεί να χρησιμοποιηθεί σε οποιονδήποτε τομέα εφαρμογών, και όχι μόνο σε χρηματοοικονομικά (όπως γίνεται κατανοητό από τον τίτλο της έκθεσης), το οποίο απαιτεί ανάλυση δεδομένων χρησιμοποιώντας διάφορες μεθόδους.

Χρηματοοικονομική διαχείριση

Η οικονομική διαχείριση είναι ένας τομέας στον οποίο η ανάλυση είναι πιο σημαντική από κάθε άλλο. Οποιαδήποτε οικονομική και διαχειριστική απόφαση προκύπτει ως αποτέλεσμα ορισμένων αναλυτικών διαδικασιών. Σήμερα, η οικονομική διαχείριση γίνεται σημαντική για την επιτυχή λειτουργία μιας επιχείρησης. Παρά το γεγονός ότι η οικονομική διαχείριση είναι μια βοηθητική διαδικασία σε μια επιχείρηση, απαιτεί ιδιαίτερη προσοχή, καθώς λανθασμένες οικονομικές και διαχειριστικές αποφάσεις μπορεί να οδηγήσουν σε μεγάλες απώλειες.

Η χρηματοοικονομική διαχείριση αποσκοπεί στην παροχή στην επιχείρηση οικονομικών πόρων στους απαιτούμενους όγκους, τη σωστή στιγμή και στο σωστό μέρος, προκειμένου να επιτευχθεί το μέγιστο αποτέλεσμα από τη χρήση τους μέσω της βέλτιστης διανομής.

Είναι ίσως δύσκολο να καθοριστεί το επίπεδο της «μέγιστης αποδοτικότητας των πόρων», αλλά σε κάθε περίπτωση,

Ο CFO πρέπει πάντα να γνωρίζει:

  • Πόσοι οικονομικοί πόροι είναι διαθέσιμοι;
  • Από πού θα προέλθουν τα κεφάλαια και σε ποιες ποσότητες;
  • πού να επενδύσεις πιο αποτελεσματικά και γιατί;
  • και σε ποια χρονικά σημεία χρειάζεται να γίνουν όλα αυτά;
  • πόσο χρειάζεται για να διασφαλιστεί η κανονική λειτουργία της επιχείρησης;

Για να λάβετε εύλογες απαντήσεις σε αυτά τα ερωτήματα, είναι απαραίτητο να έχετε, να αναλύσετε και να ξέρετε πώς να αναλύετε έναν αρκετά μεγάλο αριθμό δεικτών απόδοσης. Επιπλέον, η FU καλύπτει έναν τεράστιο αριθμό τομέων: ανάλυση ταμειακών ροών (κινήσεις Χρήματα), ανάλυση περιουσιακών στοιχείων και υποχρεώσεων, ανάλυση κερδοφορίας, οριακή ανάλυση, ανάλυση κερδοφορίας, ανάλυση κατάταξης.

Η γνώση

Επομένως, βασικός παράγοντας για την αποτελεσματικότητα της διαδικασίας οικονομικής διαχείρισης είναι η διαθεσιμότητα της γνώσης:

  • Προσωπικές γνώσεις στο αντικείμενο (μπορεί να πει κανείς θεωρητικές και μεθοδολογικές), συμπεριλαμβανομένης της εμπειρίας, της διαίσθησης ενός χρηματοδότη/οικονομικού διευθυντή
  • Γενικές (εταιρικές) γνώσεις ή συστηματικές πληροφορίες σχετικά με τα γεγονότα των χρηματοοικονομικών συναλλαγών σε μια επιχείρηση (δηλαδή πληροφορίες σχετικά με την προηγούμενη, παρούσα και μελλοντική κατάσταση της επιχείρησης, που παρουσιάζονται σε διάφορους δείκτες και μετρήσεις)

Εάν το πρώτο έγκειται στο πεδίο των ενεργειών αυτού του χρηματοδότη (ή του διευθυντή ανθρώπινου δυναμικού που προσέλαβε αυτόν τον υπάλληλο), τότε το δεύτερο θα πρέπει να δημιουργηθεί σκόπιμα στην επιχείρηση από τις κοινές προσπάθειες των υπαλλήλων των οικονομικών και πληροφοριών.

Τι υπάρχει τώρα

Ωστόσο, τώρα μια παράδοξη κατάσταση είναι χαρακτηριστική στις επιχειρήσεις: υπάρχουν πληροφορίες, υπάρχουν πολλές, πάρα πολλές. Αλλά βρίσκεται σε μια χαοτική κατάσταση: αδόμητη, ασυνεπής, κατακερματισμένη, όχι πάντα αξιόπιστη και συχνά λανθασμένη, είναι σχεδόν αδύνατο να βρεθεί και να αποκτηθεί. Πραγματοποιείται μακροχρόνια και συχνά άχρηστη δημιουργία βουνών οικονομικές δηλώσεις, που είναι άβολο για χρηματοοικονομική ανάλυση και δυσνόητο, καθώς δεν δημιουργείται για εσωτερική διαχείριση, αλλά για παροχή σε εξωτερικές ρυθμιστικές αρχές.

Σύμφωνα με τα αποτελέσματα μελέτης που διεξήγαγε η εταιρεία ReutersΜεταξύ 1.300 διεθνών μάνατζερ, το 38% των ερωτηθέντων λέει ότι αφιερώνει πολύ χρόνο προσπαθώντας να βρει τις πληροφορίες που χρειάζονται. Αποδεικνύεται ότι ένας υψηλά καταρτισμένος ειδικός ξοδεύει πολύ αμειβόμενο χρόνο όχι για ανάλυση δεδομένων, αλλά για συλλογή, αναζήτηση και συστηματοποίηση των πληροφοριών που είναι απαραίτητες για αυτήν την ανάλυση. Ταυτόχρονα, οι μάνατζερ είναι υπερφορτωμένοι με δεδομένα που συχνά είναι άσχετα, γεγονός που μειώνει και πάλι την αποτελεσματικότητα της δουλειάς τους. Ο λόγος για αυτήν την κατάσταση: υπερβολική πληροφόρηση και έλλειψη γνώσης.

Τι να κάνω

Η πληροφορία πρέπει να μετατραπεί σε γνώση. Για τις σύγχρονες επιχειρήσεις, η πολύτιμη πληροφορία, η συστηματική απόκτηση, σύνθεση, ανταλλαγή, χρήση τους είναι ένα είδος νομίσματος, αλλά για να τις λάβεις είναι απαραίτητο να διαχειριστείς πληροφορίες, όπως κάθε επιχειρηματική διαδικασία.

Το κλειδί για τη διαχείριση πληροφοριών είναι η παροχή των σωστών πληροφοριών στη σωστή μορφή στους ενδιαφερόμενους φορείς εντός του οργανισμού τη σωστή στιγμή. Ο στόχος μιας τέτοιας διαχείρισης είναι να βοηθήσει τους ανθρώπους να συνεργάζονται καλύτερα χρησιμοποιώντας αυξανόμενες ποσότητες πληροφοριών.

Η τεχνολογία της πληροφορίας σε αυτή την περίπτωση λειτουργεί ως μέσο με το οποίο θα ήταν δυνατή η συστηματοποίηση των πληροφοριών σε μια επιχείρηση, η παροχή πρόσβασης σε ορισμένους χρήστες σε αυτήν και η παροχή των εργαλείων για τη μετατροπή αυτών των πληροφοριών σε γνώση.

Βασικές έννοιες των τεχνολογιών OLAP

Οι τεχνολογίες OLAP (από το αγγλικό On-Line Analytical Processing) είναι το όνομα όχι ενός συγκεκριμένου προϊόντος, αλλά μιας ολόκληρης τεχνολογίας για τη λειτουργική ανάλυση πολυδιάστατων δεδομένων που συσσωρεύονται σε μια αποθήκη. Για να κατανοήσουμε την ουσία του OLAP, είναι απαραίτητο να εξετάσουμε την παραδοσιακή διαδικασία λήψης πληροφοριών για τη λήψη αποφάσεων.

Παραδοσιακό σύστημα υποστήριξης αποφάσεων

Εδώ, φυσικά, μπορεί να υπάρχουν πολλές επιλογές: πλήρες χάος πληροφοριών ή η πιο τυπική κατάσταση όταν η επιχείρηση διαθέτει λειτουργικά συστήματα με τη βοήθεια των οποίων τα γεγονότα ορισμένων λειτουργιών καταγράφονται και αποθηκεύονται σε βάσεις δεδομένων. Για την εξαγωγή δεδομένων από βάσεις δεδομένων για αναλυτικούς σκοπούς, έχει κατασκευαστεί ένα σύστημα ερωτημάτων για συγκεκριμένα δείγματα δεδομένων.

Αλλά αυτή η μέθοδος υποστήριξης αποφάσεων στερείται ευελιξίας και έχει πολλά μειονεκτήματα:

  • χρησιμοποιείται αμελητέος όγκος δεδομένων που μπορεί να είναι χρήσιμος για τη λήψη αποφάσεων
  • μερικές φορές δημιουργούνται περίπλοκες πολυσέλιδες αναφορές, από τις οποίες χρησιμοποιούνται 1-2 γραμμές (οι υπόλοιπες για κάθε περίπτωση) - υπερφόρτωση πληροφοριών
  • αργή απόκριση της διαδικασίας στις αλλαγές: εάν απαιτείται νέα αναπαράσταση δεδομένων, το αίτημα πρέπει να περιγραφεί επίσημα και να κωδικοποιηθεί από τον προγραμματιστή και μόνο τότε να εκτελεστεί. Χρόνος αναμονής: ώρες, ημέρες. Ή ίσως χρειάζεται μια λύση τώρα, άμεσα. Αλλά μετά τη λήψη νέων πληροφοριών, θα προκύψει μια νέα ερώτηση (διευκρίνιση)

Εάν οι αναφορές ερωτημάτων παρουσιάζονται σε μονοδιάστατη μορφή, τότε τα επιχειρηματικά προβλήματα είναι συνήθως πολυδιάστατα και πολύπλευρα. Αν θέλετε να αποκτήσετε μια σαφή εικόνα της επιχείρησης μιας εταιρείας, τότε πρέπει να αναλύσετε δεδομένα από διάφορες οπτικές γωνίες.

Πολλές εταιρείες δημιουργούν άριστα σχεσιακές βάσεις δεδομένωνδεδομένα, ταξινομώντας ιδανικά βουνά αχρησιμοποίητων πληροφοριών, που από μόνο του δεν παρέχουν ούτε γρήγορη ούτε επαρκώς ικανή αντίδραση στα γεγονότα της αγοράς. ΝΑΙ - οι σχεσιακές βάσεις δεδομένων ήταν, είναι και θα είναι η καταλληλότερη τεχνολογία για την αποθήκευση εταιρικών δεδομένων. Δεν είναι για νέα τεχνολογία DB, αλλά μάλλον για εργαλεία ανάλυσης που συμπληρώνουν τις λειτουργίες των υπαρχόντων DBMS και είναι αρκετά ευέλικτα ώστε να παρέχουν και να αυτοματοποιούν ΔΙΑΦΟΡΕΤΙΚΟΙ ΤΥΠΟΙδιανοητική ανάλυση που είναι εγγενής στο OLAP.

Κατανόηση του OLAP

Τι παρέχει η OLAP;

  • Προηγμένα εργαλεία πρόσβασης δεδομένων αποθήκευσης
  • Δυναμική διαδραστική χειραγώγηση δεδομένων (περιστροφή, ενοποίηση ή εξάσκηση)
  • Καθαρή οπτική εμφάνιση δεδομένων
  • Γρήγορη – η ανάλυση πραγματοποιείται σε πραγματικό χρόνο
  • Πολυδιάστατη παρουσίαση δεδομένων - ταυτόχρονη ανάλυση ενός αριθμού δεικτών σε διάφορες διαστάσεις

Για να έχετε το αποτέλεσμα της χρήσης τεχνολογιών OLAP, πρέπει: 1) να κατανοήσετε την ουσία των ίδιων των τεχνολογιών και τις δυνατότητές τους. 2) ορίστε με σαφήνεια ποιες διαδικασίες πρέπει να αναλυθούν, από ποιους δείκτες θα χαρακτηριστούν και σε ποιες διαστάσεις είναι σκόπιμο να τις δείτε, δηλαδή να δημιουργήσετε ένα μοντέλο ανάλυσης.

Οι βασικές έννοιες στις οποίες λειτουργούν οι τεχνολογίες OLAP είναι οι εξής:

Πολυδιάστατη

Για να κατανοήσετε την πολυδιάσταση των δεδομένων, θα πρέπει πρώτα να παρουσιάσετε έναν πίνακα που να δείχνει, για παράδειγμα, την απόδοση του Κόστους Επιχείρησης ανά οικονομικά στοιχεία και επιχειρηματικές μονάδες.

Αυτά τα δεδομένα παρουσιάζονται σε δύο διαστάσεις:

  • άρθρο
  • επιχειρηματική μονάδα

Αυτός ο πίνακας δεν είναι ενημερωτικός, καθώς δείχνει τις πωλήσεις για μια συγκεκριμένη χρονική περίοδο. Για διαφορετικές χρονικές περιόδους, οι αναλυτές θα πρέπει να συγκρίνουν πολλούς πίνακες (για κάθε χρονική περίοδο):

Το σχήμα δείχνει μια 3η διάσταση, τον Χρόνο, εκτός από τις δύο πρώτες. (Άρθρο, επιχειρηματική μονάδα)

Ένας άλλος τρόπος εμφάνισης πολυδιάστατων δεδομένων είναι να τα αναπαραστήσετε με τη μορφή κύβου:

Οι κύβοι OLAP επιτρέπουν στους αναλυτές να λαμβάνουν δεδομένα σε διάφορα τμήματα για να λάβουν απαντήσεις σε ερωτήσεις που θέτει η επιχείρηση:

  • Ποιες δαπάνες είναι κρίσιμες σε ποιες επιχειρηματικές μονάδες;
  • Πώς αλλάζει το κόστος επιχειρηματικής μονάδας με την πάροδο του χρόνου;
  • Πώς αλλάζουν τα στοιχεία κόστους με την πάροδο του χρόνου;

Απαντήσεις σε τέτοιες ερωτήσεις είναι απαραίτητες για τη λήψη αποφάσεων διαχείρισης: για τη μείωση ορισμένων στοιχείων κόστους, τον αντίκτυπο στη δομή τους, τον εντοπισμό των λόγων για τις αλλαγές στο κόστος με την πάροδο του χρόνου, τις αποκλίσεις από το σχέδιο και την εξάλειψή τους - βελτιστοποίηση της δομής τους.

Σε αυτό το παράδειγμα, λαμβάνονται υπόψη μόνο 3 διαστάσεις. Είναι δύσκολο να απεικονίσεις περισσότερες από 3 διαστάσεις, αλλά λειτουργεί με τον ίδιο τρόπο όπως με τις 3 διαστάσεις.

Συνήθως, οι εφαρμογές OLAP σάς επιτρέπουν να λαμβάνετε δεδομένα για 3 ή περισσότερες διαστάσεις, για παράδειγμα, μπορείτε να προσθέσετε μια ακόμη διάσταση - Πρόγραμμα-Πραγματικό, Κατηγορία κόστους: άμεση, έμμεση, ανά παραγγελίες, ανά μήνες. Οι πρόσθετες διαστάσεις σάς επιτρέπουν να λαμβάνετε πιο αναλυτικές φέτες και να δίνετε απαντήσεις σε ερωτήσεις με πολλαπλές συνθήκες.

Ιεραρχία

Το OLAP επιτρέπει επίσης στους αναλυτές να οργανώνουν κάθε διάσταση σε μια ιεραρχία ομάδων, υποομάδων και συνόλων που αντικατοπτρίζουν το μέτρο σε ολόκληρο τον οργανισμό - τον πιο λογικό τρόπο ανάλυσης μιας επιχείρησης.

Για παράδειγμα, συνιστάται να ομαδοποιήσετε το κόστος ιεραρχικά:

Το OLAP επιτρέπει στους αναλυτές να εξετάσουν τη συνολική συνοπτική μέτρηση (στο ανώτερο επίπεδο) και στη συνέχεια να προχωρήσουν στο κάτω και στα επόμενα επίπεδα για να ανακαλύψουν τον ακριβή λόγο για τον οποίο άλλαξε η μέτρηση.

Επιτρέποντας στους αναλυτές να χρησιμοποιούν πολλαπλές διαστάσεις σε έναν κύβο δεδομένων, με τη δυνατότητα να κατασκευάζουν ιεραρχικά διαστάσεις, το OLAP παρέχει μια εικόνα της επιχείρησης που δεν συμπιέζεται από τη δομή της αποθήκης πληροφοριών.

Αλλαγή κατευθύνσεων ανάλυσης σε κύβο (περιστρεφόμενα δεδομένα)

Κατά κανόνα, λειτουργούν σε έννοιες: διαστάσεις που καθορίζονται σε στήλες, σειρές (μπορεί να υπάρχουν πολλές από αυτές), τα υπόλοιπα αποτελούν φέτες, τα περιεχόμενα του πίνακα διαστάσεις (πωλήσεις, κόστος, μετρητά)

Συνήθως, το OLAP σάς επιτρέπει να αλλάξετε τον προσανατολισμό των διαστάσεων του κύβου, παρουσιάζοντας έτσι τα δεδομένα σε διαφορετικές προβολές.

Η εμφάνιση των δεδομένων κύβου εξαρτάται από:

  • προσανατολισμοί διάστασης: ποιες διαστάσεις καθορίζονται σε σειρές, στήλες, φέτες.
  • ομάδες δεικτών, που επισημαίνονται σε σειρές, στήλες, φέτες.
  • Η αλλαγή διαστάσεων εμπίπτει στο πεδίο των ενεργειών του χρήστη.

Έτσι, το OLAP σάς επιτρέπει να πραγματοποιείτε διάφορους τύπους αναλύσεων και να κατανοείτε τις σχέσεις τους με τα αποτελέσματά τους.

  • Η ανάλυση απόκλισης είναι μια ανάλυση της υλοποίησης του σχεδίου, η οποία συμπληρώνεται από παραγοντική ανάλυση των αιτιών των αποκλίσεων με λεπτομέρεια των δεικτών.
  • Ανάλυση εξάρτησης: Το OLAP σάς επιτρέπει να εντοπίσετε διάφορες εξαρτήσεις μεταξύ των διαφόρων αλλαγών, για παράδειγμα, όταν η μπύρα αφαιρέθηκε από τη συλλογή κατά τους δύο πρώτους μήνες, ανακαλύφθηκε πτώση στις πωλήσεις κατσαρίδας.
  • Σύγκριση (συγκριτική ανάλυση). Σύγκριση των αποτελεσμάτων των αλλαγών σε έναν δείκτη με την πάροδο του χρόνου, για μια δεδομένη ομάδα αγαθών, σε διαφορετικές περιοχές κ.λπ.
  • Η ανάλυση της δυναμικής μας επιτρέπει να εντοπίσουμε ορισμένες τάσεις στις αλλαγές των δεικτών με την πάροδο του χρόνου.

Αποδοτικότητα: μπορούμε να πούμε ότι το OLAP βασίζεται στους νόμους της ψυχολογίας: τη δυνατότητα επεξεργασίας αιτημάτων πληροφοριών σε «πραγματικό χρόνο» - με τον ρυθμό της διαδικασίας αναλυτικής κατανόησης δεδομένων από τον χρήστη.

Εάν μια σχεσιακή βάση δεδομένων μπορεί να διαβάσει περίπου 200 εγγραφές ανά δευτερόλεπτο και να γράψει 20, τότε ένας καλός διακομιστής OLAP, χρησιμοποιώντας υπολογισμένες γραμμές και στήλες, μπορεί να ενοποιήσει 20.000-30.000 κελιά (που ισοδυναμούν με μία εγγραφή σε μια σχεσιακή βάση δεδομένων) ανά δευτερόλεπτο.

Ορατότητα: Πρέπει να τονιστεί ότι το OLAP παρέχει προηγμένα μέσα γραφικής παρουσίασης δεδομένων στον τελικό χρήστη. Ο ανθρώπινος εγκέφαλος είναι ικανός να αντιλαμβάνεται και να αναλύει πληροφορίες που παρουσιάζονται με τη μορφή γεωμετρικών εικόνων, σε όγκο που είναι αρκετές τάξεις μεγέθους μεγαλύτερος από τις πληροφορίες που παρουσιάζονται σε αλφαριθμητική μορφή. Παράδειγμα: Ας υποθέσουμε ότι πρέπει να βρείτε ένα οικείο πρόσωπο σε μία από τις εκατό φωτογραφίες. Πιστεύω ότι αυτή η διαδικασία δεν θα σας πάρει περισσότερο από ένα λεπτό. Τώρα φανταστείτε ότι αντί για φωτογραφίες θα σας προσφερθούν εκατό λεκτικές περιγραφές των ίδιων προσώπων. Νομίζω ότι δεν θα μπορέσετε να λύσετε καθόλου το προτεινόμενο πρόβλημα.

Απλότητα: Το κύριο χαρακτηριστικό αυτών των τεχνολογιών είναι ότι προορίζονται για χρήση από μη ειδικούς του κλάδου Τεχνολογίες πληροφορικής, όχι ειδικός στατιστικολόγος, αλλά επαγγελματίας στον εφαρμοσμένο τομέα - διευθυντής τμήματος πιστώσεων, διευθυντής τμήματος προϋπολογισμού και, τέλος, διευθυντής. Έχουν σχεδιαστεί για να επικοινωνεί ο αναλυτής με το πρόβλημα, όχι με τον υπολογιστή..

Παρά τις μεγάλες δυνατότητες του OLAP (επιπλέον, η ιδέα είναι σχετικά παλιά - τη δεκαετία του '60), η πραγματική του χρήση δεν βρίσκεται σχεδόν ποτέ στις επιχειρήσεις μας. Γιατί;

  • δεν υπάρχουν πληροφορίες ή δεν είναι ξεκάθαρες οι δυνατότητες
  • συνήθεια να σκέφτεσαι δισδιάστατα
  • εμπόδιο τιμών
  • υπερβολικό τεχνολογικό περιεχόμενο άρθρων που είναι αφιερωμένα στο OLAP: οι ασυνήθιστοι όροι είναι τρομακτικοί - OLAP, «εξόρυξη δεδομένων και τεμαχισμός», «ad hoc ερωτήματα», «προσδιορισμός σημαντικών συσχετίσεων»

Η δική μας και δυτική προσέγγιση στη χρήση του OLAP

Επιπλέον, έχουμε επίσης μια συγκεκριμένη κατανόηση της χρησιμότητας εφαρμογών του OLAP, ακόμη και ενώ κατανοούμε τις τεχνολογικές του δυνατότητες.

Οι συγγραφείς μας και οι Ρώσοι συντάκτες διαφόρων υλικών αφιερωμένων στο OLAP εκφράζουν την ακόλουθη γνώμη σχετικά με τη χρησιμότητα του OLAP: οι περισσότεροι αντιλαμβάνονται το OLAP ως ένα εργαλείο που σας επιτρέπει να επεκτείνετε και να συμπτύξετε δεδομένα απλά και άνετα, πραγματοποιώντας τους χειρισμούς που έρχονται στο μυαλό του αναλυτή κατά τη διάρκεια της διαδικασία ανάλυσης. Όσο περισσότερες «φέτες» και «τμήματα» δεδομένων βλέπει ο αναλυτής, τόσο περισσότερες ιδέες έχει, οι οποίες, με τη σειρά τους, απαιτούν όλο και περισσότερες «φέτες» για επαλήθευση. Δεν είναι σωστό.

Η δυτική κατανόηση της χρησιμότητας του OLAP βασίζεται σε ένα μοντέλο μεθοδολογικής ανάλυσης που πρέπει να ενσωματωθεί κατά το σχεδιασμό λύσεων OLAP. Ο αναλυτής δεν πρέπει να παίζει με τον κύβο OLAP και να αλλάζει άσκοπα τις διαστάσεις και τα επίπεδα λεπτομέρειας, τον προσανατολισμό δεδομένων, τη γραφική απεικόνιση των δεδομένων (και αυτό χρειάζεται πραγματικά!), αλλά να κατανοεί σαφώς ποιες προβολές χρειάζεται, με ποια σειρά και γιατί (φυσικά , τα στοιχεία " μπορεί να υπάρχουν ανακαλύψεις εδώ, αλλά δεν είναι θεμελιώδες για τη χρησιμότητα του OLAP).

Εφαρμογές OLAP

  • Προϋπολογισμός
  • Ροή κεφαλαίων

Ένας από τους πιο γόνιμους τομείς εφαρμογής των τεχνολογιών OLAP. Δεν είναι τυχαίο που κανένα σύγχρονο σύστημα προϋπολογισμού δεν θεωρείται ολοκληρωμένο χωρίς την παρουσία εργαλείων OLAP για ανάλυση προϋπολογισμού. Οι περισσότερες αναφορές προϋπολογισμού δημιουργούνται εύκολα με βάση τα συστήματα OLAP. Ταυτόχρονα, οι εκθέσεις απαντούν σε ένα πολύ ευρύ φάσμα ερωτήσεων: ανάλυση της δομής των εξόδων και των εσόδων, σύγκριση δαπανών για ορισμένα είδη σε διαφορετικά τμήματα, ανάλυση της δυναμικής και των τάσεων των δαπανών για ορισμένα είδη, ανάλυση του κόστους και κέρδη.

Το OLAP θα σας επιτρέψει να αναλύσετε τις ταμειακές εισροές και εκροές στο πλαίσιο των επιχειρηματικών λειτουργιών, των αντισυμβαλλομένων, των νομισμάτων και του χρόνου, προκειμένου να βελτιστοποιήσετε τις ροές τους.

  • Οικονομικές και διαχειριστικές αναφορές (με αναλυτικά στοιχεία που χρειάζεται η διοίκηση)
  • Εμπορία
  • Ισορροπημένη κάρτα βαθμολογίας
  • Ανάλυση Κερδοφορίας

Εάν έχετε τα κατάλληλα δεδομένα, μπορείτε να βρείτε διάφορες εφαρμογές της τεχνολογίας OLAP.

προϊόντα OLAP

Αυτή η ενότητα θα συζητήσει το OLAP ως λύση λογισμικού.

Γενικές απαιτήσεις για προϊόντα OLAP

Υπάρχουν πολλοί τρόποι για την υλοποίηση εφαρμογών OLAP, επομένως δεν θα έπρεπε να απαιτείται ή να έχει προταθεί καμία συγκεκριμένη τεχνολογία. Κάτω από διαφορετικές συνθήκες και συνθήκες, μια προσέγγιση μπορεί να είναι προτιμότερη από μια άλλη. Οι τεχνικές υλοποίησης περιλαμβάνουν πολλές διαφορετικές ιδιόκτητες ιδέες για τις οποίες οι πωλητές είναι τόσο περήφανοι: παραλλαγές αρχιτεκτονικής πελάτη-διακομιστή, ανάλυση χρονοσειρών, προσανατολισμός αντικειμένων, βελτιστοποίηση αποθήκευσης δεδομένων, παράλληλες διεργασίες, κ.λπ. Αλλά αυτές οι τεχνολογίες δεν μπορούν να αποτελούν μέρος του ορισμού του OLAP.

Υπάρχουν χαρακτηριστικά που πρέπει να τηρούνται σε όλα τα προϊόντα OLAP (αν πρόκειται για προϊόν OLAP), που είναι το ιδανικό της τεχνολογίας. Αυτοί είναι 5 βασικοί ορισμοί που χαρακτηρίζουν το OLAP (το λεγόμενο τεστ FASMI): Γρήγορη Ανάλυση Κοινόχρηστων Πολυδιάστατων Πληροφοριών.

  • Γρήγορα(FAST) σημαίνει ότι το σύστημα θα πρέπει να είναι σε θέση να παρέχει τις περισσότερες απαντήσεις στους χρήστες εντός περίπου πέντε δευτερολέπτων. Ακόμη και αν το σύστημα προειδοποιήσει ότι η διαδικασία θα διαρκέσει πολύ περισσότερο, οι χρήστες μπορεί να αποσπαστούν και να χάσουν τις σκέψεις τους και η ποιότητα της ανάλυσης θα υποφέρει. Αυτή η ταχύτητα δεν είναι εύκολο να επιτευχθεί με μεγάλες ποσότητες δεδομένων, ειδικά εάν απαιτούνται ειδικοί υπολογισμοί κατά τη διάρκεια της πτήσης. Οι πωλητές καταφεύγουν σε μια μεγάλη ποικιλία μεθόδων για να επιτύχουν αυτόν τον στόχο, συμπεριλαμβανομένων εξειδικευμένων μορφών αποθήκευσης δεδομένων, εκτεταμένων προκαταρκτικών υπολογισμών ή ολοένα και πιο αυστηρών απαιτήσεων υλικού. Ωστόσο, επί του παρόντος δεν υπάρχουν πλήρως βελτιστοποιημένες λύσεις. Εκ πρώτης όψεως, μπορεί να φαίνεται περίεργο ότι όταν λαμβάνει μια αναφορά σε ένα λεπτό που πριν από λίγο κράτησε μέρες, ο χρήστης βαριέται πολύ γρήγορα ενώ περιμένει και το έργο αποδεικνύεται πολύ λιγότερο επιτυχημένο από ό,τι στην περίπτωση μιας στιγμής ανταπόκριση, ακόμη και με το κόστος μιας λιγότερο λεπτομερούς ανάλυσης.
  • Κοινή χρήσησημαίνει ότι το σύστημα καθιστά δυνατή την εκπλήρωση όλων των απαιτήσεων προστασίας δεδομένων και την εφαρμογή κατανεμημένης και ταυτόχρονης πρόσβασης στα δεδομένα για διαφορετικά επίπεδα χρηστών. Το σύστημα πρέπει να μπορεί να χειρίζεται πολλές αλλαγές δεδομένων έγκαιρα και με ασφάλεια. Αυτή είναι μια σημαντική αδυναμία πολλών προϊόντων OLAP, τα οποία τείνουν να υποθέτουν ότι όλες οι εφαρμογές OLAP είναι μόνο για ανάγνωση και παρέχουν απλοποιημένους ελέγχους ασφαλείας.
  • Πολυδιάστατοείναι βασική απαίτηση. Αν έπρεπε να ορίσετε το OLAP με μία λέξη, θα το επιλέγατε. Το σύστημα πρέπει να παρέχει μια πολυδιάστατη εννοιολογική άποψη των δεδομένων, συμπεριλαμβανομένης της πλήρους υποστήριξης για ιεραρχίες και πολλαπλές ιεραρχίες, καθώς αυτό καθορίζει τον πιο λογικό τρόπο ανάλυσης της επιχείρησης. Δεν υπάρχει ελάχιστος αριθμός διαστάσεων που πρέπει να υποβληθούν σε επεξεργασία, καθώς αυτό εξαρτάται επίσης από την εφαρμογή και τα περισσότερα προϊόντα OLAP έχουν επαρκή αριθμό διαστάσεων για τις αγορές στις οποίες απευθύνονται. Και πάλι, δεν προσδιορίζουμε ποια υποκείμενη τεχνολογία βάσης δεδομένων θα πρέπει να χρησιμοποιηθεί εάν ο χρήστης πρόκειται να αποκτήσει μια πραγματικά πολυδιάστατη εννοιολογική άποψη των πληροφοριών. Αυτή η δυνατότητα είναι η καρδιά του OLAP
  • Πληροφορίες.Οι απαραίτητες πληροφορίες πρέπει να λαμβάνονται όπου χρειάζονται, ανεξάρτητα από τον όγκο και τη θέση αποθήκευσης. Ωστόσο, πολλά εξαρτώνται από την εφαρμογή. Η ισχύς των διαφόρων προϊόντων μετριέται ως προς το πόσα δεδομένα εισόδου μπορούν να επεξεργαστούν, αλλά όχι με το πόσα gigabyte μπορούν να αποθηκεύσουν. Η ισχύς των προϊόντων ποικίλλει πολύ - τα μεγαλύτερα προϊόντα OLAP μπορούν να χειριστούν τουλάχιστον χίλιες φορές περισσότερα δεδομένα από τα μικρότερα. Υπάρχουν πολλοί παράγοντες που πρέπει να ληφθούν υπόψη από αυτή την άποψη, συμπεριλαμβανομένου του διπλασιασμού δεδομένων, των απαιτήσεων RAM, της χρήσης χώρου στο δίσκο, των μετρήσεων απόδοσης, της ενοποίησης με αποθήκες πληροφοριών κ.λπ.
  • Ανάλυσησημαίνει ότι το σύστημα μπορεί να χειριστεί οποιαδήποτε λογική και στατιστική ανάλυση ειδικά για μια δεδομένη εφαρμογή και διασφαλίζει ότι είναι αποθηκευμένη σε μορφή προσβάσιμη στον τελικό χρήστη. Ο χρήστης θα πρέπει να μπορεί να ορίζει νέους προσαρμοσμένους υπολογισμούς ως μέρος της ανάλυσης χωρίς την ανάγκη προγραμματισμού. Δηλαδή, όλες οι απαιτούμενες λειτουργίες ανάλυσης πρέπει να παρέχονται με διαισθητικό τρόπο για τους τελικούς χρήστες. Τα εργαλεία ανάλυσης θα μπορούσαν να περιλαμβάνουν ορισμένες διαδικασίες, όπως ανάλυση χρονοσειρών, κατανομή κόστους, μεταφορές νομισμάτων, αναζήτηση στόχων κ.λπ. Τέτοιες δυνατότητες διαφέρουν πολύ μεταξύ των προϊόντων, ανάλογα με τον προσανατολισμό στόχο.

Με άλλα λόγια, αυτοί οι 5 βασικοί ορισμοί είναι οι στόχοι που έχουν σχεδιαστεί για να επιτύχουν τα προϊόντα OLAP.

Τεχνολογικές πτυχές του OLAP

Ένα σύστημα OLAP περιλαμβάνει ορισμένα στοιχεία. Υπάρχουν διάφορα σχήματα λειτουργίας τους που μπορεί να εφαρμόσει αυτό ή εκείνο το προϊόν.

Στοιχεία συστημάτων OLAP (από τι αποτελείται ένα σύστημα OLAP;)

Συνήθως, ένα σύστημα OLAP περιλαμβάνει τα ακόλουθα στοιχεία:

  • Πηγή δεδομένων
    Η πηγή από την οποία λαμβάνονται τα δεδομένα για ανάλυση (αποθήκη δεδομένων, βάση δεδομένων λειτουργικών λογιστικών συστημάτων, σύνολο πινάκων, συνδυασμοί των παραπάνω).
  • Διακομιστής OLAP
    Τα δεδομένα από την πηγή μεταφέρονται ή αντιγράφονται στον διακομιστή OLAP, όπου συστηματοποιούνται και προετοιμάζονται για ταχύτερη δημιουργία απαντήσεων σε ερωτήματα.
  • πελάτης OLAP
    Διεπαφή χρήστη με τον διακομιστή OLAP στον οποίο λειτουργεί ο χρήστης

Πρέπει να σημειωθεί ότι δεν απαιτούνται όλα τα εξαρτήματα. Υπάρχουν επιτραπέζια συστήματα OLAP που σας επιτρέπουν να αναλύετε δεδομένα που είναι αποθηκευμένα απευθείας στον υπολογιστή του χρήστη και δεν απαιτούν διακομιστή OLAP.

Ωστόσο, το στοιχείο που απαιτείται είναι η πηγή δεδομένων: η διαθεσιμότητα δεδομένων είναι ένα σημαντικό ζήτημα. Εάν υπάρχουν, σε οποιαδήποτε μορφή, όπως πίνακας Excel, στη βάση δεδομένων του λογιστικού συστήματος ή με τη μορφή δομημένων αναφορών από υποκαταστήματα, ο ειδικός πληροφορικής θα μπορεί να ενσωματωθεί στο σύστημα OLAP απευθείας ή με ενδιάμεση μετατροπή. Τα συστήματα OLAP διαθέτουν ειδικά εργαλεία για αυτό. Εάν αυτά τα δεδομένα δεν είναι διαθέσιμα ή είναι ανεπαρκούς πληρότητας και ποιότητας, το OLAP δεν θα βοηθήσει. Δηλαδή, το OLAP είναι μόνο μια υπερκατασκευή πάνω στα δεδομένα, και αν δεν υπάρχει, γίνεται άχρηστο πράγμα.

Τα περισσότερα δεδομένα για εφαρμογές OLAP προέρχονται από άλλα συστήματα. Ωστόσο, σε ορισμένες εφαρμογές (για παράδειγμα, προγραμματισμός ή προϋπολογισμός), τα δεδομένα μπορούν να δημιουργηθούν απευθείας σε εφαρμογές OLAP. Όταν τα δεδομένα προέρχονται από άλλες εφαρμογές, είναι συνήθως απαραίτητο τα δεδομένα να αποθηκεύονται σε ξεχωριστή, διπλή μορφή για την εφαρμογή OLAP. Επομένως, συνιστάται η δημιουργία αποθηκών δεδομένων.

Να σημειωθεί ότι ο όρος «OLAP» είναι άρρηκτα συνδεδεμένος με τον όρο «αποθήκη δεδομένων» (Data Warehouse). Η αποθήκη δεδομένων είναι μια συλλογή δεδομένων που βασίζεται σε συγκεκριμένο τομέα, βάσει χρόνου και αμετάβλητη για την υποστήριξη της λήψης αποφάσεων διαχείρισης. Τα δεδομένα στην αποθήκη προέρχονται από λειτουργικά συστήματα (OLTP συστήματα), τα οποία έχουν σχεδιαστεί για την αυτοματοποίηση των επιχειρηματικών διαδικασιών, η αποθήκη μπορεί να αναπληρωθεί από εξωτερικές πηγές, για παράδειγμα, στατιστικές αναφορές.

Παρά το γεγονός ότι περιέχουν προφανώς περιττές πληροφορίες που υπάρχουν ήδη σε βάσεις δεδομένων ή αρχεία λειτουργικού συστήματος, οι αποθήκες δεδομένων είναι απαραίτητες επειδή:

  • κατακερματισμός δεδομένων, αποθήκευση σε διάφορες μορφές DBMS·
  • Η απόδοση ανάκτησης δεδομένων βελτιώνεται
  • εάν σε μια επιχείρηση όλα τα δεδομένα αποθηκεύονται σε έναν κεντρικό διακομιστή βάσης δεδομένων (πράγμα εξαιρετικά σπάνιο), ο αναλυτής πιθανότατα δεν θα κατανοήσει τις περίπλοκες, μερικές φορές συγκεχυμένες δομές τους
  • σύνθετα αναλυτικά ερωτήματα για λειτουργικές πληροφορίες επιβραδύνουν την τρέχουσα εργασία της εταιρείας, μπλοκάρουν πίνακες για μεγάλο χρονικό διάστημα και καταλαμβάνουν πόρους διακομιστή
  • ικανότητα καθαρισμού και εναρμόνισης δεδομένων
  • είναι αδύνατο ή πολύ δύσκολο να αναλυθούν άμεσα δεδομένα από λειτουργικά συστήματα.

Ο σκοπός του αποθετηρίου είναι να παρέχει την «πρώτη ύλη» για ανάλυση σε ένα μέρος και σε μια απλή, κατανοητή δομή. Δηλαδή, η έννοια της αποθήκευσης δεδομένων δεν είναι μια έννοια ανάλυσης δεδομένων, μάλλον είναι μια έννοια προετοιμασίας δεδομένων για ανάλυση. Περιλαμβάνει την υλοποίηση μιας ενιαίας ολοκληρωμένης πηγής δεδομένων.

Προϊόντα OLAP: αρχιτεκτονικές

Όταν χρησιμοποιείτε προϊόντα OLAP, δύο ερωτήσεις είναι σημαντικές: πώς και πού διατήρησηΚαι επεξεργάζομαι, διαδικασίαδεδομένα. Ανάλογα με το πώς υλοποιούνται αυτές οι δύο διαδικασίες, διακρίνονται οι αρχιτεκτονικές OLAP. Υπάρχουν 3 τρόποι αποθήκευσης δεδομένων για το OLAP και 3 τρόποι επεξεργασίας αυτών των δεδομένων. Πολλοί κατασκευαστές προσφέρουν πολλές επιλογές, ορισμένοι προσπαθούν να αποδείξουν ότι η προσέγγισή τους είναι η πιο συνετή. Αυτό είναι, φυσικά, παράλογο. Ωστόσο, πολύ λίγα προϊόντα μπορούν να λειτουργήσουν αποτελεσματικά σε περισσότερους από έναν τρόπους.

Επιλογές αποθήκευσης δεδομένων OLAP

Αποθήκευση σε αυτό το πλαίσιο σημαίνει διατήρηση των δεδομένων σε κατάσταση διαρκώς ενημερωμένη.

  • Σχεσιακές βάσεις δεδομένων: Αυτή είναι μια τυπική επιλογή εάν μια επιχείρηση αποθηκεύει λογιστικά δεδομένα σε μια RDB. Στις περισσότερες περιπτώσεις, τα δεδομένα θα πρέπει να αποθηκεύονται σε μια αποκανονικοποιημένη δομή (το πιο κατάλληλο είναι ένα σχήμα αστεριού). Μια κανονικοποιημένη βάση δεδομένων δεν είναι αποδεκτή λόγω της πολύ χαμηλής απόδοσης ερωτήματος κατά τη δημιουργία συγκεντρωτικών στοιχείων για το OLAP (συχνά τα δεδομένα που προκύπτουν αποθηκεύονται σε συγκεντρωτικούς πίνακες).
  • Αρχεία βάσης δεδομένων στον υπολογιστή-πελάτη (κιόσκια ή μάρκες δεδομένων): Αυτά τα δεδομένα μπορούν να προκατανεμηθούν ή να δημιουργηθούν από ερωτήματα σε υπολογιστές-πελάτες.

Πολυδιάστατες βάσεις δεδομένων: υποθέστε ότι τα δεδομένα αποθηκεύονται σε μια πολυδιάστατη βάση δεδομένων στο διακομιστή. Μπορεί να περιλαμβάνει δεδομένα που εξάγονται και συνοψίζονται από άλλα συστήματα και σχεσιακές βάσεις δεδομένων, αρχεία τελικού χρήστη κ.λπ. Στις περισσότερες περιπτώσεις, οι πολυδιάστατες βάσεις δεδομένων αποθηκεύονται στο δίσκο, αλλά ορισμένα προϊόντα σάς επιτρέπουν να χρησιμοποιείτε τη μνήμη RAM, υπολογίζοντας τα πιο συχνά χρησιμοποιούμενα δεδομένα εν κινήσει " Πολύ λίγα προϊόντα που βασίζονται σε πολυδιάστατες βάσεις δεδομένων επιτρέπουν την πολλαπλή επεξεργασία δεδομένων, πολλά προϊόντα επιτρέπουν μεμονωμένη επεξεργασία αλλά πολλαπλές αναγνώσεις δεδομένων, ενώ άλλα περιορίζονται μόνο στην ανάγνωση.

Αυτές οι τρεις θέσεις αποθήκευσης έχουν διαφορετικές δυνατότητες αποθήκευσης και είναι διατεταγμένες με φθίνουσα σειρά χωρητικότητας. Έχουν επίσης διαφορετικά χαρακτηριστικά απόδοσης ερωτημάτων: οι σχεσιακές βάσεις δεδομένων είναι πολύ πιο αργές από τις δύο τελευταίες επιλογές.

Επιλογές για την επεξεργασία δεδομένων OLAP

Υπάρχουν 3 από τις ίδιες επιλογές επεξεργασίας δεδομένων:

  • Χρήση SQL: Αυτή η επιλογή, φυσικά, χρησιμοποιείται κατά την αποθήκευση δεδομένων σε ένα RDB. Ωστόσο, η SQL δεν επιτρέπει πολυδιάστατους υπολογισμούς σε ένα μόνο ερώτημα, επομένως απαιτεί τη σύνταξη σύνθετων ερωτημάτων SQL για να επιτευχθούν περισσότερες από βασικές πολυδιάστατες λειτουργίες. Ωστόσο, αυτό δεν εμποδίζει τους προγραμματιστές να προσπαθήσουν. Στις περισσότερες περιπτώσεις, εκτελούν περιορισμένο αριθμό σχετικών υπολογισμών σε SQL, με αποτελέσματα που μπορούν να ληφθούν από πολυδιάστατη επεξεργασία δεδομένων ή από το μηχάνημα πελάτη. Είναι επίσης δυνατή η χρήση μνήμης RAM που μπορεί να αποθηκεύσει δεδομένα χρησιμοποιώντας περισσότερα από ένα αιτήματα: αυτό βελτιώνει δραματικά την απόκριση.
  • Πολυδιάστατη επεξεργασία στον πελάτη: Το προϊόν OLAP πελάτη κάνει τους υπολογισμούς μόνο του, αλλά αυτή η επεξεργασία είναι διαθέσιμη μόνο εάν οι χρήστες διαθέτουν σχετικά ισχυρούς υπολογιστές.

Πολυδιάστατη επεξεργασία από την πλευρά του διακομιστή: Αυτό είναι ένα δημοφιλές μέρος για την εκτέλεση πολυδιάστατων υπολογισμών σε εφαρμογές OLAP πελάτη-διακομιστή και χρησιμοποιείται σε πολλά προϊόντα. Η απόδοση είναι συνήθως υψηλή επειδή οι περισσότεροι υπολογισμοί έχουν ήδη γίνει. Ωστόσο, αυτό απαιτεί πολύ χώρο στο δίσκο.

Μήτρα αρχιτεκτονικών OLAP

Αντίστοιχα, με το συνδυασμό επιλογών αποθήκευσης/επεξεργασίας, είναι δυνατό να ληφθεί ένας πίνακας αρχιτεκτονικών συστημάτων OLAP. Αντίστοιχα, θεωρητικά μπορούν να υπάρχουν 9 συνδυασμοί αυτών των μεθόδων. Ωστόσο, δεδομένου ότι 3 από αυτά στερούνται κοινής λογικής, στην πραγματικότητα υπάρχουν μόνο 6 επιλογές για την αποθήκευση και την επεξεργασία δεδομένων OLAP.

Πολυδιάστατες επιλογές αποθήκευσης
δεδομένα

Επιλογές
πολυδιάστατο
επεξεργασία δεδομένων

Σχεσιακή βάση δεδομένων

Πολυδιάστατη βάση δεδομένων από την πλευρά του διακομιστή

Υπολογιστής πελάτη

Cartesis Magnitude

Πολυδιάστατη επεξεργασία διακομιστή

Crystal Holos (λειτουργία ROLAP)

Διακομιστής IBM DB2 OLAP

CA EUREKA: Στρατηγική

Informix MetaCube

Speedware Media/MR

Υπηρεσίες ανάλυσης της Microsoft

Oracle Express (λειτουργία ROLAP)

Pilot Analysis Server

Εφαρμογή iTM1

Crystal Holos

Απόφαση Comshare

Hyperion Essbase

Oracle Express

Speedware Media/M

Υπηρεσίες ανάλυσης της Microsoft

PowerPlay Enterprise Server

Pilot Analysis Server

Εφαρμογή iTM1

Πολυδιάστατη επεξεργασία στον υπολογιστή-πελάτη

Oracle Discoverer

Informix MetaCube

Διαστατική Ενόραση

Hyperion Enterprise

Cognos PowerPlay

Personal Express

Προοπτικές iTM1

Δεδομένου ότι ο χώρος αποθήκευσης είναι αυτός που καθορίζει την επεξεργασία, είναι συνηθισμένο να ομαδοποιούνται κατά επιλογές αποθήκευσης, δηλαδή:

  • Προϊόντα ROLAP στους τομείς 1, 2, 3
  • OLAP επιτραπέζιου υπολογιστή - στον τομέα 6

Προϊόντα MOLAP – στους τομείς 4 και 5

Προϊόντα HOLAP (επιτρέποντας τόσο πολυδιάστατες όσο και σχεσιακές επιλογές αποθήκευσης δεδομένων) – σε 2 και 4 (με πλάγιους χαρακτήρες)

Κατηγορίες προϊόντων OLAP

Υπάρχουν περισσότεροι από 40 προμηθευτές OLAP, αν και δεν μπορούν όλοι να θεωρηθούν ανταγωνιστές επειδή οι δυνατότητές τους είναι πολύ διαφορετικές και, στην πραγματικότητα, δραστηριοποιούνται σε διαφορετικά τμήματα της αγοράς. Μπορούν να ομαδοποιηθούν σε 4 θεμελιώδεις κατηγορίες, οι διαφορές μεταξύ των οποίων βασίζονται στις ακόλουθες έννοιες: σύνθετη λειτουργικότητα - απλή λειτουργικότητα, απόδοση - χώρος στο δίσκο. Είναι χρήσιμο να απεικονίζονται οι κατηγορίες σε σχήμα τετραγώνου γιατί δείχνει ξεκάθαρα τις σχέσεις μεταξύ τους. Το διακριτικό χαρακτηριστικό κάθε κατηγορίας αντιπροσωπεύεται από την πλευρά της και οι ομοιότητες με άλλες αντιπροσωπεύονται στις παρακείμενες πλευρές, επομένως, οι κατηγορίες στις αντίθετες πλευρές είναι θεμελιωδώς διαφορετικές.

Ιδιαιτερότητες

Πλεονεκτήματα

Ελαττώματα

εκπροσώπους

Εφαρμόστηκε το OLAP

Ολοκληρωμένες εφαρμογές με πλούσια λειτουργικότητα. Σχεδόν όλα απαιτούν μια πολυδιάστατη βάση δεδομένων, αν και ορισμένες λειτουργούν με μια σχεσιακή. Πολλές από αυτήν την κατηγορία εφαρμογών είναι εξειδικευμένες, όπως πωλήσεις, κατασκευή, τραπεζικές εργασίες, προϋπολογισμός, οικονομική ενοποίηση, ανάλυση πωλήσεων

Δυνατότητα ενσωμάτωσης με διάφορες εφαρμογές

Υψηλό επίπεδο λειτουργικότητας

Υψηλό επίπεδο ευελιξίας και επεκτασιμότητας

Πολυπλοκότητα εφαρμογής (απαιτείται εκπαίδευση χρήστη)

Υψηλή τιμή

Hyperion Solutions

Κρυστάλλινες Αποφάσεις

Κατασκευαστές Πληροφοριών

Το προϊόν βασίζεται σε μια μη σχεσιακή δομή δεδομένων που παρέχει πολυδιάστατη αποθήκευση, επεξεργασία και παρουσίαση δεδομένων. Κατά τη διαδικασία ανάλυσης, τα δεδομένα επιλέγονται αποκλειστικά από μια πολυδιάστατη δομή. Παρά το υψηλό επίπεδο διαφάνειας, οι προμηθευτές πείθουν τους αγοραστές να αγοράσουν τα δικά τους εργαλεία

Υψηλή απόδοση (γρήγοροι υπολογισμοί συνοπτικών δεικτών και διάφοροι πολυδιάστατοι μετασχηματισμοί για οποιαδήποτε από τις διαστάσεις). Ο μέσος χρόνος απόκρισης σε ένα ad hoc αναλυτικό ερώτημα όταν χρησιμοποιείται μια πολυδιάστατη βάση δεδομένων είναι συνήθως 1-2 τάξεις μεγέθους μικρότερος από ό,τι στην περίπτωση ενός RDB

Υψηλό επίπεδο ανοίγματος: μεγάλος αριθμός προϊόντων με τα οποία είναι δυνατή η ενσωμάτωση

Αντιμετωπίζουν εύκολα τις εργασίες συμπερίληψης διαφόρων ενσωματωμένων λειτουργιών στο μοντέλο πληροφοριών, διεξαγωγής εξειδικευμένης ανάλυσης από τον χρήστη κ.λπ.

Η ανάγκη για μεγάλο χώρο στο δίσκο για την αποθήκευση δεδομένων (λόγω του πλεονασμού των δεδομένων που αποθηκεύονται). Αυτή είναι μια εξαιρετικά αναποτελεσματική χρήση της μνήμης - λόγω της αποκανονικοποίησης και της εκ των προτέρων συνάθροισης, ο όγκος των δεδομένων σε μια πολυδιάστατη βάση δεδομένων αντιστοιχεί σε 2,5-100 φορές λιγότερο από τον όγκο των αρχικών λεπτομερών δεδομένων. Σε κάθε περίπτωση, η MOLAP δεν σας επιτρέπει να συνεργαστείτε μεγάλες βάσεις δεδομένωνδεδομένα. Το πραγματικό όριο είναι μια βάση δεδομένων 10-25 gigabyte

Η πιθανότητα «έκρηξης» μιας βάσης δεδομένων είναι μια απροσδόκητη, απότομη, δυσανάλογη αύξηση του όγκου της

Έλλειψη ευελιξίας όσον αφορά την τροποποίηση δομών δεδομένων. Οποιαδήποτε αλλαγή στη δομή των διαστάσεων σχεδόν πάντα απαιτεί πλήρη αναδιάρθρωση του υπερκύβου

Για πολυδιάστατες βάσεις δεδομένων, δεν υπάρχουν επί του παρόντος ενιαία πρότυπα για τη διεπαφή, τις γλώσσες για την περιγραφή και τον χειρισμό δεδομένων

Hyperion (Essbase)

DOLAP (OLAP για επιτραπέζιους υπολογιστές)

Πελάτη προϊόντα OLAP που είναι αρκετά εύκολο να εφαρμοστούν και έχουν χαμηλό κόστος ανά θέση

Μιλάμε για τέτοια αναλυτική επεξεργασία όπου οι υπερκύβοι είναι μικροί, η διάστασή τους μικρή, οι ανάγκες μέτριες και για τέτοια αναλυτική επεξεργασία αρκεί μια προσωπική μηχανή σε επιτραπέζιο υπολογιστή.

Ο στόχος των παραγωγών αυτής της αγοράς είναι να αυτοματοποιήσουν εκατοντάδες και χιλιάδες θέσεις εργασίας, αλλά οι χρήστες πρέπει να κάνουν μια αρκετά απλή ανάλυση. Οι αγοραστές συχνά ενθαρρύνονται να αγοράσουν περισσότερες θέσεις εργασίας από όσες χρειάζεται

Καλή ενοποίηση με βάσεις δεδομένων: πολυδιάστατη, σχεσιακή

Δυνατότητα πραγματοποίησης σύνθετων αγορών, που μειώνει το κόστος των έργων υλοποίησης

Ευκολία στη χρήση των εφαρμογών

Πολύ περιορισμένη λειτουργικότητα (δεν συγκρίνεται από αυτή την άποψη με εξειδικευμένα προϊόντα)

Πολύ περιορισμένη ισχύς (μικροί όγκοι δεδομένων, μικρός αριθμός μετρήσεων)

Cognos (PowerPlay)

Επιχειρηματικά αντικείμενα

Κρυστάλλινες Αποφάσεις

Αυτός είναι ο μικρότερος τομέας της αγοράς.

Τα λεπτομερή δεδομένα παραμένουν εκεί που ήταν αρχικά - στη σχεσιακή βάση δεδομένων. ορισμένα συγκεντρωτικά στοιχεία αποθηκεύονται στην ίδια βάση δεδομένων σε ειδικά δημιουργημένους πίνακες υπηρεσιών

Δυνατότητα χειρισμού πολύ μεγάλων ποσοτήτων δεδομένων (οικονομική αποθήκευση)

Παρέχετε έναν τρόπο λειτουργίας πολλών χρηστών, συμπεριλαμβανομένης της λειτουργίας επεξεργασίας και όχι μόνο ανάγνωσης

Υψηλότερο επίπεδο προστασίας δεδομένων και καλές επιλογές για τη διαφοροποίηση των δικαιωμάτων πρόσβασης

Είναι δυνατές συχνές αλλαγές στη δομή μέτρησης (δεν απαιτείται φυσική αναδιοργάνωση της βάσης δεδομένων)

Χαμηλή απόδοση, σημαντικά κατώτερη ως προς την ταχύτητα απόκρισης σε σχέση με τις πολυδιάστατες (απόκριση σε πολύπλοκα ερωτήματαμετριέται σε λεπτά ή και ώρες αντί για δευτερόλεπτα). Αυτά είναι καλύτερα εργαλεία δημιουργίας αναφορών από διαδραστικά εργαλεία ανάλυσης

Πολυπλοκότητα προϊόντων. Απαιτεί σημαντικό κόστος συντήρησης από ειδικούς της πληροφορικής. Για να παρέχουν επιδόσεις συγκρίσιμες με το MOLAP, τα σχεσιακά συστήματα απαιτούν προσεκτικό σχεδιασμό του σχήματος της βάσης δεδομένων και διαμόρφωση των ευρετηρίων, δηλαδή μεγάλη προσπάθεια από την πλευρά των διαχειριστών βάσεων δεδομένων

Ακριβό στην εφαρμογή

Οι περιορισμοί της SQL παραμένουν πραγματικότητα, γεγονός που εμποδίζει την υλοποίηση στο RDBMS πολλών ενσωματωμένων λειτουργιών που παρέχονται εύκολα σε συστήματα που βασίζονται σε πολυδιάστατη αναπαράσταση δεδομένων

Πλεονέκτημα πληροφοριών

Informix (MetaCube)

Πρέπει να σημειωθεί ότι οι καταναλωτές υβριδικών προϊόντων που επιτρέπουν την επιλογή λειτουργίας ROLAP και MOLAP, όπως Microsoft Analysis Services, Oracle Express, Crystal Holos, IBM DB2 OLAPServer, σχεδόν πάντα επιλέγουν τη λειτουργία MOLAP.

Κάθε μία από τις παρουσιαζόμενες κατηγορίες έχει τα δικά της δυνατά και αδύνατα σημεία, δεν υπάρχει κανένας βέλτιστη επιλογή. Η επιλογή επηρεάζει 3 σημαντικές πτυχές: 1) απόδοση? 2) χώρο στο δίσκο για αποθήκευση δεδομένων. 3) οι δυνατότητες, η λειτουργικότητα και κυρίως η επεκτασιμότητα της λύσης OLAP. Σε αυτή την περίπτωση, είναι απαραίτητο να ληφθεί υπόψη ο όγκος των δεδομένων που υποβάλλονται σε επεξεργασία, η ισχύς του εξοπλισμού, οι ανάγκες των χρηστών και να αναζητηθεί συμβιβασμός μεταξύ της ταχύτητας και του πλεονασμού του χώρου στο δίσκο που καταλαμβάνει η βάση δεδομένων, της απλότητας και της ευελιξίας.

Ταξινόμηση των Αποθηκών Δεδομένων σύμφωνα με τον όγκο της βάσης δεδομένων στόχου

Μειονεκτήματα του OLAP

Όπως κάθε τεχνολογία, το OLAP έχει επίσης τα μειονεκτήματά του: υψηλές απαιτήσεις για υλικό, εκπαίδευση και γνώση του διοικητικού προσωπικού και των τελικών χρηστών, υψηλό κόστος για την υλοποίηση του έργου υλοποίησης (τόσο χρηματικό όσο και χρονικό, πνευματικό).

Επιλογή προϊόντος OLAP

Η επιλογή του σωστού προϊόντος OLAP είναι δύσκολη, αλλά πολύ σημαντική εάν θέλετε το έργο να μην αποτύχει.

Όπως μπορείτε να δείτε, οι διαφορές προϊόντων βρίσκονται σε πολλούς τομείς: λειτουργικούς, αρχιτεκτονικούς, τεχνικούς. Ορισμένα προϊόντα έχουν πολύ περιορισμένες ρυθμίσεις. Ορισμένα έχουν δημιουργηθεί για εξειδικευμένους τομείς: μάρκετινγκ, πωλήσεις, χρηματοδότηση. Υπάρχουν προϊόντα για γενικούς σκοπούς, τα οποία δεν έχουν συγκεκριμένη χρήση για εφαρμογή, τα οποία πρέπει να είναι αρκετά ευέλικτα. Κατά κανόνα, τέτοια προϊόντα είναι φθηνότερα από τα εξειδικευμένα, αλλά το κόστος υλοποίησης είναι υψηλότερο. Η γκάμα των προϊόντων OLAP είναι πολύ μεγάλη - από τα απλούστερα εργαλεία για τη δημιουργία συγκεντρωτικών πινάκων και γραφημάτων που αποτελούν μέρος προϊόντων γραφείου, έως εργαλεία για την ανάλυση δεδομένων και την αναζήτηση μοτίβων, που κοστίζουν δεκάδες χιλιάδες δολάρια.

Όπως σε κάθε άλλο τομέα, στον τομέα του OLAP δεν μπορούν να υπάρχουν σαφείς οδηγίες για την επιλογή εργαλείων. Μπορείτε να εστιάσετε μόνο σε ορισμένα βασικά σημεία και να συγκρίνετε τις προτεινόμενες δυνατότητες λογισμικού με τις ανάγκες του οργανισμού. Ένα πράγμα είναι σημαντικό: χωρίς να σκέφτεστε σωστά πώς θα χρησιμοποιήσετε τα εργαλεία OLAP, κινδυνεύετε να δημιουργήσετε έναν μεγάλο πονοκέφαλο στον εαυτό σας.

Κατά τη διαδικασία επιλογής, υπάρχουν 2 ερωτήματα που πρέπει να ληφθούν υπόψη:

  • αξιολογεί τις ανάγκες και τις δυνατότητες της επιχείρησης
  • αξιολογήστε την υπάρχουσα προσφορά στην αγορά, οι τάσεις ανάπτυξης είναι επίσης σημαντικές

Στη συνέχεια, συγκρίνετε όλα αυτά και, στην πραγματικότητα, κάντε μια επιλογή.

Αξιολόγηση αναγκών

Δεν μπορείτε να κάνετε μια λογική επιλογή προϊόντος χωρίς να κατανοήσετε σε τι θα χρησιμοποιηθεί. Πολλές εταιρείες θέλουν το «καλύτερο δυνατό προϊόν» χωρίς σαφή κατανόηση του τρόπου χρήσης του.

Προκειμένου το έργο να υλοποιηθεί επιτυχώς, ο οικονομικός διευθυντής πρέπει, τουλάχιστον, να διατυπώσει σωστά τις επιθυμίες και τις απαιτήσεις του στον διευθυντή και στους ειδικούς υπηρεσιών αυτοματισμού. Πολλά προβλήματα προκύπτουν λόγω της ανεπαρκούς προετοιμασίας και ευαισθητοποίησης για την επιλογή των ειδικών της OLAP και των τελικών χρηστών αντιμετωπίζουν δυσκολίες επικοινωνίας απλώς και μόνο επειδή χειραγωγούν διαφορετικές έννοιες και όρους κατά τη διάρκεια της συνομιλίας και προβάλλουν αντικρουόμενες προτιμήσεις. Πρέπει να υπάρχει συνέπεια στους στόχους εντός της εταιρείας.

Ορισμένοι παράγοντες έχουν ήδη γίνει προφανείς μετά την ανάγνωση της επισκόπησης των κατηγοριών προϊόντων OLAP, και συγκεκριμένα:

Τεχνικές πτυχές

  • Πηγές δεδομένων: εταιρική αποθήκη δεδομένων, σύστημα OLTP, αρχεία πινάκων, σχεσιακές βάσεις δεδομένων. Δυνατότητα σύνδεσης εργαλείων OLAP με όλα τα DBMS που χρησιμοποιούνται στον οργανισμό. Όπως δείχνει η πρακτική, η ενσωμάτωση ετερογενών προϊόντων σε ένα σταθερό λειτουργικό σύστημα είναι ένα από τα πιο σημαντικά ζητήματα και η επίλυσή του σε ορισμένες περιπτώσεις μπορεί να σχετίζεται με μεγάλα προβλήματα. Είναι απαραίτητο να κατανοήσουμε πόσο απλά και αξιόπιστα είναι δυνατό να ενσωματωθούν τα εργαλεία OLAP με το DBMS που υπάρχει στον οργανισμό. Είναι επίσης σημαντικό να αξιολογήσετε τις δυνατότητες ενοποίησης όχι μόνο με πηγές δεδομένων, αλλά και με άλλες εφαρμογές στις οποίες μπορεί να χρειαστεί να εξαγάγετε δεδομένα: email, εφαρμογές γραφείου
  • Η μεταβλητότητα των δεδομένων λαμβάνεται υπόψη
  • Πλατφόρμα διακομιστή: NT, Unix, AS/400, Linux - αλλά μην επιμένετε ότι τα προϊόντα προδιαγραφών OLAP εκτελούνται σε αμφισβητήσιμες ή ετοιμοθάνατες πλατφόρμες που εξακολουθείτε να χρησιμοποιείτε
  • Πρότυπα από πλευράς πελάτη και προγράμματος περιήγησης
  • Αναπτυσσόμενη αρχιτεκτονική: το τοπικό δίκτυοκαι σύνδεση μόντεμ υπολογιστή, πελάτη/διακομιστή υψηλής ταχύτητας, intranet, extranet, Internet
  • Διεθνείς δυνατότητες: Υποστήριξη πολλαπλών νομισμάτων, πολύγλωσσες λειτουργίες, κοινή χρήση δεδομένων, τοπική προσαρμογή, αδειοδότηση, ενημέρωση των Windows

Ποσότητες πληροφοριών εισόδου που είναι διαθέσιμες και που θα εμφανιστούν στο μέλλον

Χρήστες

  • Τομέας εφαρμογής: ανάλυση πωλήσεων/μάρκετινγκ, προϋπολογισμός/σχεδιασμός, ανάλυση απόδοσης, ανάλυση λογιστικών εκθέσεων, ποιοτική ανάλυση, οικονομική κατάσταση, παραγωγή αναλυτικού υλικού (αναφορές)
  • Αριθμός χρηστών και τοποθεσία τους, απαιτήσεις για την κατανομή των δικαιωμάτων πρόσβασης σε δεδομένα και λειτουργίες, απόρρητο (απόρρητο) πληροφοριών
  • Τύπος χρήστη: ανώτερη διοίκηση, οικονομικά, μάρκετινγκ, ανθρώπινο δυναμικό, πωλήσεις, παραγωγή κ.λπ.
  • Εμπειρία χρήστη. Επίπεδο δεξιοτήτων χρήστη. Εξετάστε το ενδεχόμενο παροχής εκπαίδευσης. Είναι πολύ σημαντικό η εφαρμογή πελάτη OLAP να έχει σχεδιαστεί έτσι ώστε οι χρήστες να αισθάνονται σίγουροι και να μπορούν να τη χρησιμοποιούν αποτελεσματικά.

Βασικά χαρακτηριστικά: Ανάγκες εγγραφής δεδομένων, κατανεμημένος υπολογισμός, σύνθετες μετατροπές νομισμάτων, ανάγκες εκτύπωσης αναφορών, διεπαφή υπολογιστικών φύλλων, πολυπλοκότητα λογικής εφαρμογής, απαιτούμενες διαστάσεις, τύποι ανάλυσης: στατιστική, αναζήτηση στόχων, ανάλυση "What-If"

Εκτέλεση

  • Ποιοι θα συμμετάσχουν στην υλοποίηση και λειτουργία: εξωτερικοί σύμβουλοι, εσωτερική λειτουργία πληροφορικής ή τελικοί χρήστες
  • Προϋπολογισμός: λογισμικό, υλικό, υπηρεσίες, μετάδοση δεδομένων. Να θυμάστε ότι η πληρωμή για άδειες προϊόντων OLAP είναι μόνο ένα μικρό μέρος του συνολικού κόστους του έργου. Το κόστος υλοποίησης και υλικού μπορεί να είναι μεγαλύτερο από το τέλος άδειας χρήσης και το κόστος μακροπρόθεσμης υποστήριξης, λειτουργίας και διαχείρισης είναι σχεδόν σίγουρα πολύ μεγαλύτερο. Και αν πάρετε τη λάθος απόφαση να αγοράσετε το λάθος προϊόν μόνο και μόνο επειδή είναι φθηνότερο, μπορεί να καταλήξετε με υψηλότερο συνολικό κόστος έργου λόγω υψηλότερου κόστους συντήρησης, διαχείρισης και/ή υλικού για αυτό που πιθανότατα θα πάρετε περισσότερα χαμηλό επίπεδοεπιχειρηματικά οφέλη. Κατά την εκτίμηση του συνολικού κόστους, φροντίστε να κάνετε τις ακόλουθες ερωτήσεις: Πόσο εκτενείς είναι οι διαθέσιμες πηγές υλοποίησης, εκπαίδευσης και υποστήριξης; Είναι πιθανό το δυνητικό γενικό ταμείο (εργαζόμενοι, εργολάβοι, σύμβουλοι) να αυξηθεί ή να συρρικνωθεί; Πόσο ευρέως μπορείτε να χρησιμοποιήσετε τη βιομηχανική επαγγελματική σας εμπειρία;

Παρά το γεγονός ότι το κόστος των αναλυτικών συστημάτων παραμένει αρκετά υψηλό ακόμη και σήμερα, και οι μεθοδολογίες και οι τεχνολογίες για την εφαρμογή τέτοιων συστημάτων είναι ακόμη σε αρχικό στάδιο, σήμερα το οικονομικό αποτέλεσμα που παρέχουν υπερβαίνει σημαντικά το αποτέλεσμα των παραδοσιακών λειτουργικών συστημάτων.

Η επίδραση της σωστής οργάνωσης, στρατηγικού και λειτουργικού σχεδιασμού της επιχειρηματικής ανάπτυξης είναι δύσκολο να ποσοτικοποιηθεί εκ των προτέρων, αλλά είναι προφανές ότι μπορεί να υπερβεί το κόστος εφαρμογής τέτοιων συστημάτων κατά δεκάδες ή και εκατοντάδες φορές. Ωστόσο, δεν πρέπει να κάνει κανείς λάθος. Το αποτέλεσμα δεν διασφαλίζεται από το ίδιο το σύστημα, αλλά από τους ανθρώπους που εργάζονται με αυτό. Επομένως, δηλώσεις όπως: «ένα σύστημα τεχνολογιών αποθήκευσης δεδομένων και OLAP θα βοηθήσει τον διαχειριστή να λάβει τις σωστές αποφάσεις» δεν είναι απολύτως σωστές». Μοντέρνο αναλυτικά συστήματαδεν είναι συστήματα τεχνητής νοημοσύνης και δεν μπορούν ούτε να βοηθήσουν ούτε να εμποδίσουν τη λήψη αποφάσεων. Στόχος τους είναι να παρέχουν αμέσως στον διευθυντή όλες τις απαραίτητες πληροφορίες για τη λήψη μιας απόφασης σε μια βολική μορφή. Και ποιες πληροφορίες θα ζητηθούν και ποια απόφαση θα ληφθεί βάσει αυτών εξαρτάται μόνο από το συγκεκριμένο άτομο που τις χρησιμοποιεί.

Το μόνο που μένει να πούμε είναι ότι αυτά τα συστήματα μπορούν να βοηθήσουν στην επίλυση πολλών επιχειρηματικών προβλημάτων και μπορούν να έχουν εκτεταμένο θετικό αποτέλεσμα. Μένει να δούμε ποιος θα είναι ο πρώτος που θα συνειδητοποιήσει τα οφέλη αυτής της προσέγγισης και θα είναι μπροστά από τους άλλους.

OLAP(από το αγγλικό OnLine Analytical Processing - επιχειρησιακή αναλυτική επεξεργασία δεδομένων, επίσης: αναλυτική επεξεργασία δεδομένων σε πραγματικό χρόνο, διαδραστική αναλυτική επεξεργασία δεδομένων) - μια προσέγγιση για την αναλυτική επεξεργασία δεδομένων που βασίζεται στην πολυδιάστατη ιεραρχική τους αναπαράσταση, η οποία αποτελεί μέρος του ευρύτερου πεδίου πληροφοριών τεχνολογία - επιχειρήσεις -αναλυτές ().

Για έναν κατάλογο λύσεων και έργων OLAP, ανατρέξτε στην ενότητα OLAP στο TAdviser.

Από την πλευρά του χρήστη, OLAP-τα συστήματα παρέχουν εργαλεία για ευέλικτη προβολή πληροφοριών σε διάφορες ενότητες, αυτόματη λήψη συγκεντρωτικών δεδομένων, εκτέλεση αναλυτικών λειτουργιών συνέλιξης, λεπτομερειών και σύγκρισης με την πάροδο του χρόνου. Όλα αυτά καθιστούν τα συστήματα OLAP μια λύση με προφανή πλεονεκτήματα στον τομέα της προετοιμασίας δεδομένων για όλους τους τύπους επιχειρηματικών αναφορών, που περιλαμβάνει την παρουσίαση δεδομένων σε διάφορες ενότητες και διαφορετικά επίπεδα ιεραρχίας - για παράδειγμα, αναφορές πωλήσεων, διάφορες μορφές προϋπολογισμών κ.λπ. επί. Τα πλεονεκτήματα μιας τέτοιας αναπαράστασης σε άλλες μορφές ανάλυσης δεδομένων, συμπεριλαμβανομένης της πρόβλεψης, είναι προφανή.

Απαιτήσεις για συστήματα OLAP. ΦΑΣΜΗ

Η βασική απαίτηση για τα συστήματα OLAP είναι η ταχύτητα, η οποία τους επιτρέπει να χρησιμοποιηθούν στη διαδικασία της διαδραστικής εργασίας ενός αναλυτή με πληροφορίες. Υπό αυτή την έννοια, τα συστήματα OLAP έρχονται σε αντίθεση, πρώτον, με τα παραδοσιακά RDBMS, δείγματα από τα οποία με τυπικά ερωτήματα για αναλυτές που χρησιμοποιούν ομαδοποίηση και συνάθροιση δεδομένων είναι συνήθως ακριβά όσον αφορά τον χρόνο αναμονής και τη φόρτωση του RDBMS, επομένως η διαδραστική εργασία μαζί τους για οποιαδήποτε Τα δεδομένα σημαντικών όγκων είναι πολύπλοκα. Δεύτερον, τα συστήματα OLAP αντιτίθενται επίσης στη συνήθη παρουσίαση δεδομένων σε επίπεδο αρχείο, για παράδειγμα, με τη μορφή συχνά χρησιμοποιούμενων παραδοσιακών υπολογιστικών φύλλων, την παρουσίαση πολυδιάστατων δεδομένων στα οποία είναι πολύπλοκα και όχι διαισθητικά, και λειτουργίες για την αλλαγή των σημείων τομής προβολή των δεδομένων - απαιτούν επίσης χρόνο και περιπλέκουν τη διαδραστική εργασία με δεδομένα.

Ταυτόχρονα, αφενός, οι ειδικές απαιτήσεις δεδομένων για συστήματα OLAP συνήθως συνεπάγονται αποθήκευση δεδομένων σε ειδικές δομές βελτιστοποιημένες για τυπικές εργασίες OLAP, αφετέρου, η άμεση εξαγωγή δεδομένων από υπάρχοντα συστήματα κατά τη διαδικασία ανάλυσης θα οδηγούσε σε σημαντική πτώση στην απόδοσή τους.

Ως εκ τούτου, μια σημαντική απαίτηση είναι να εξασφαλιστεί η πιο ευέλικτη σύνδεση εισαγωγών-εξαγωγών μεταξύ υπάρχοντα συστήματα, ενεργώντας ως πηγή δεδομένων και σύστημα OLAP, καθώς και σύστημα OLAP και εξωτερικές εφαρμογές ανάλυσης δεδομένων και αναφοράς.

Επιπλέον, ένας τέτοιος συνδυασμός πρέπει να ικανοποιεί τις προφανείς απαιτήσεις υποστήριξης εισαγωγών-εξαγωγών από διάφορες πηγές δεδομένων, εφαρμογής διαδικασιών καθαρισμού και μετατροπής δεδομένων, ενοποίησης των χρησιμοποιούμενων ταξινομητών και βιβλίων αναφοράς. Επιπλέον σε αυτές τις απαιτήσεις προστίθεται η ανάγκη να ληφθούν υπόψη διάφοροι κύκλοι ενημέρωσης δεδομένων στα υπάρχοντα πληροφοριακά συστήματακαι ενοποίηση του απαιτούμενου επιπέδου λεπτομέρειας δεδομένων. Η πολυπλοκότητα και η ευελιξία αυτού του προβλήματος οδήγησε στην εμφάνιση της έννοιας των αποθηκών δεδομένων και, με στενή έννοια, στον προσδιορισμό μιας ξεχωριστής κατηγορίας βοηθητικών προγραμμάτων μετατροπής και μετασχηματισμού δεδομένων - ETL (Extract Transform Load).

Ενεργά μοντέλα αποθήκευσης δεδομένων

Αναφέραμε παραπάνω ότι το OLAP υποθέτει μια πολυδιάστατη ιεραρχική αναπαράσταση δεδομένων και, κατά μία έννοια, είναι αντίθετη με τα συστήματα που βασίζονται σε RDBMS.

Αυτό, ωστόσο, δεν σημαίνει ότι όλα τα συστήματα OLAP χρησιμοποιούν ένα πολυδιάστατο μοντέλο για την αποθήκευση ενεργών, «λειτουργικών» δεδομένων συστήματος. Δεδομένου ότι το ενεργό μοντέλο αποθήκευσης δεδομένων επηρεάζει όλες τις απαιτήσεις που υπαγορεύονται από τη δοκιμή FASMI, η σημασία του τονίζεται από το γεγονός ότι σε αυτή τη βάση διακρίνονται παραδοσιακά οι υποτύποι OLAP - πολυδιάστατοι (MOLAP), σχεσικοί (ROLAP) και υβριδικοί (HOLAP).

Ωστόσο, ορισμένοι ειδικοί, με επικεφαλής τους προαναφερθέντες Νάιτζελ Πεντς, υποδεικνύουν ότι η ταξινόμηση με βάση ένα κριτήριο δεν είναι αρκετά πλήρης. Επιπλέον, η συντριπτική πλειοψηφία των υφιστάμενων συστημάτων OLAP θα σχετίζεται με υβριδικού τύπου. Ως εκ τούτου, θα σταθούμε λεπτομερέστερα στα ενεργά μοντέλα αποθήκευσης δεδομένων, αναφέροντας ποια από αυτά αντιστοιχούν σε ποιους από τους παραδοσιακούς υποτύπους OLAP.

Αποθήκευση ενεργών δεδομένων σε πολυδιάστατη βάση δεδομένων

Σε αυτήν την περίπτωση, τα δεδομένα OLAP αποθηκεύονται σε πολυδιάστατα DBMS που χρησιμοποιούν σχέδια βελτιστοποιημένα για αυτόν τον τύπο δεδομένων. Συνήθως, τα πολυδιάστατα DBMS υποστηρίζουν όλες τις τυπικές λειτουργίες OLAP, συμπεριλαμβανομένης της συνάθροισης κατά μήκος των απαιτούμενων επιπέδων ιεραρχίας και ούτω καθεξής.

Αυτός ο τύπος αποθήκευσης δεδομένων, κατά μία έννοια, μπορεί να ονομαστεί κλασικός για το OLAP. Ωστόσο, όλα τα βήματα για την προκαταρκτική προετοιμασία των δεδομένων είναι απολύτως απαραίτητα για αυτό. Συνήθως, τα πολυδιάστατα δεδομένα DBMS αποθηκεύονται στο δίσκο, ωστόσο, σε ορισμένες περιπτώσεις, για να επιταχυνθεί η επεξεργασία δεδομένων, τέτοια συστήματα επιτρέπουν την αποθήκευση δεδομένων στη μνήμη RAM. Για τους ίδιους σκοπούς, μερικές φορές χρησιμοποιείται η αποθήκευση προ-υπολογισμένων συγκεντρωτικών τιμών και άλλων υπολογισμένων τιμών στη βάση δεδομένων.

Τα πολυδιάστατα DBMS που υποστηρίζουν πλήρως την πρόσβαση πολλών χρηστών με ανταγωνιστικές συναλλαγές ανάγνωσης και εγγραφής είναι αρκετά σπάνια η συνήθης λειτουργία για τέτοια DBMS είναι ένας χρήστης με πρόσβαση εγγραφής με πρόσβαση ανάγνωσης πολλών χρηστών ή μόνο για ανάγνωση πολλών χρηστών.

Μεταξύ των αδυναμιών που χαρακτηρίζουν ορισμένες υλοποιήσεις πολυδιάστατων DBMS και συστημάτων OLAP που βασίζονται σε αυτά, μπορεί κανείς να σημειώσει την ευαισθησία τους σε μια απρόβλεπτη αύξηση του χώρου που καταλαμβάνει η βάση δεδομένων από την άποψη του χρήστη. Αυτό το αποτέλεσμα προκαλείται από την επιθυμία να ελαχιστοποιηθεί ο χρόνος αντίδρασης του συστήματος, ο οποίος υπαγορεύει την αποθήκευση προ-υπολογισμένων τιμών αθροιστικών δεικτών και άλλων ποσοτήτων στη βάση δεδομένων, γεγονός που προκαλεί μια μη γραμμική αύξηση του όγκου των πληροφοριών που αποθηκεύονται στη βάση δεδομένων με την προσθήκη νέων τιμών δεδομένων ή μετρήσεων.

Ο βαθμός στον οποίο εκδηλώνεται αυτό το πρόβλημα, καθώς και τα σχετικά προβλήματα της αποτελεσματικής αποθήκευσης αραιών κύβων δεδομένων, καθορίζεται από την ποιότητα των προσεγγίσεων και των αλγορίθμων που χρησιμοποιούνται για συγκεκριμένες υλοποιήσεις συστημάτων OLAP.

Αποθήκευση ενεργών δεδομένων σε μια σχεσιακή βάση δεδομένων

Τα δεδομένα OLAP μπορούν επίσης να αποθηκευτούν σε ένα παραδοσιακό RDBMS. Στις περισσότερες περιπτώσεις, αυτή η προσέγγιση χρησιμοποιείται κατά την προσπάθεια «ανώδυνης» ενσωμάτωσης του OLAP με υπάρχοντα λογιστικά συστήματα ή αποθήκες δεδομένων που βασίζονται σε RDBMS. Ταυτόχρονα, αυτή η προσέγγιση απαιτεί ορισμένες πρόσθετες δυνατότητες από το RDBMS για τη διασφάλιση της αποτελεσματικής εκπλήρωσης των απαιτήσεων της δοκιμής FASMI (ιδίως, διασφαλίζοντας ελάχιστο χρόνο απόκρισης του συστήματος). Συνήθως, τα δεδομένα OLAP αποθηκεύονται σε αποκανονική μορφή και ορισμένα από τα προυπολογισμένα συγκεντρωτικά στοιχεία και τιμές αποθηκεύονται σε ειδικούς πίνακες. Όταν αποθηκεύεται σε κανονικοποιημένη μορφή, η αποτελεσματικότητα του RDBMS ως μεθόδου για την αποθήκευση ενεργών δεδομένων μειώνεται.

Το πρόβλημα της επιλογής αποτελεσματικών προσεγγίσεων και αλγορίθμων για την αποθήκευση προυπολογισμένων δεδομένων είναι επίσης σημαντικό για συστήματα OLAP που βασίζονται σε RDBMS, επομένως οι κατασκευαστές τέτοιων συστημάτων συνήθως εστιάζουν στα πλεονεκτήματα των προσεγγίσεων που χρησιμοποιούνται.

Γενικά, πιστεύεται ότι τα συστήματα OLAP που βασίζονται σε RDBMS πιο αργά συστήματα, που βασίζεται σε πολυδιάστατα DBMS, μεταξύ άλλων λόγω των δομών αποθήκευσης δεδομένων που είναι λιγότερο αποτελεσματικές για εργασίες OLAP, αλλά στην πράξη αυτό εξαρτάται από τα χαρακτηριστικά ενός συγκεκριμένου συστήματος.

Μεταξύ των πλεονεκτημάτων της αποθήκευσης δεδομένων σε ένα RDBMS είναι η μεγαλύτερη επεκτασιμότητα τέτοιων συστημάτων.

Αποθήκευση ενεργών δεδομένων σε επίπεδα αρχεία

Αυτή η προσέγγιση περιλαμβάνει την αποθήκευση κομματιών δεδομένων σε κανονικά αρχεία. Συνήθως χρησιμοποιείται ως προσθήκη σε μία από τις δύο κύριες προσεγγίσεις προκειμένου να επιταχυνθεί η εργασία με την προσωρινή αποθήκευση των τρεχόντων δεδομένων στο δίσκο ή στη μνήμη RAM του υπολογιστή-πελάτη.

Υβριδική προσέγγιση στην αποθήκευση δεδομένων

Οι περισσότεροι κατασκευαστές συστημάτων OLAP που προωθούν τις ολοκληρωμένες λύσεις τους, που συχνά περιλαμβάνουν, εκτός από το ίδιο το σύστημα OLAP, DBMS, ETL (Extract Transform Load) και εργαλεία αναφοράς, χρησιμοποιούν επί του παρόντος μια υβριδική προσέγγιση για την οργάνωση της αποθήκευσης ενεργών δεδομένων συστήματος, τη διανομή τους με τον ένα ή τον άλλο τρόπο μεταξύ RDBMS και εξειδικευμένης αποθήκευσης, καθώς και μεταξύ δομών δίσκου και προσωρινής αποθήκευσης στη μνήμη.

Δεδομένου ότι η αποτελεσματικότητα μιας τέτοιας λύσης εξαρτάται από τις συγκεκριμένες προσεγγίσεις και τους αλγόριθμους που χρησιμοποιούνται από τον κατασκευαστή για να καθορίσει εάν ποια δεδομένα και πού να αποθηκεύσετε, στη συνέχεια βιαστικώς εξάγετε συμπεράσματα σχετικά με την αρχικά μεγαλύτερη αποτελεσματικότητα τέτοιων λύσεων ως κατηγορίας χωρίς να αξιολογήσετε τα ειδικά χαρακτηριστικά του υπό εξέταση συστήματος.

OLAP(eng. on-line analytical processing) – ένα σύνολο μεθόδων για δυναμική επεξεργασία πολυδιάστατων ερωτημάτων σε αναλυτικές βάσεις δεδομένων. Τέτοιες πηγές δεδομένων είναι συνήθως αρκετά μεγάλες και μία από τις πιο σημαντικές απαιτήσεις στα εργαλεία που χρησιμοποιούνται για την επεξεργασία τους είναι υψηλή ταχύτητα. Στις σχεσιακές βάσεις δεδομένων, οι πληροφορίες αποθηκεύονται σε ξεχωριστούς πίνακες που είναι καλά κανονικοποιημένοι. Αλλά πολύπλοκα ερωτήματα πολλών πινάκων εκτελούνται αρκετά αργά σε αυτά. Πολύ η καλύτερη επίδοσηΗ ταχύτητα επεξεργασίας στα συστήματα OLAP επιτυγχάνεται λόγω των ιδιαιτεροτήτων της δομής αποθήκευσης δεδομένων. Όλες οι πληροφορίες είναι σαφώς οργανωμένες και χρησιμοποιούνται δύο τύποι αποθήκευσης δεδομένων: Μετρήσεις(περιέχει καταλόγους χωρισμένους σε κατηγορίες, για παράδειγμα, σημεία πώλησης, πελάτες, εργαζόμενους, υπηρεσίες κ.λπ.) και δεδομένα(χαρακτηρίστε την αλληλεπίδραση των στοιχείων διάφορες μετρήσεις, για παράδειγμα, στις 3 Μαρτίου 2010, ο πωλητής Α παρείχε μια υπηρεσία στον πελάτη Β στο κατάστημα Γ για το ποσό των χρηματικών μονάδων D). Τα μέτρα χρησιμοποιούνται για τον υπολογισμό των αποτελεσμάτων στον κύβο ανάλυσης. Τα μέτρα είναι συλλογές γεγονότων που συγκεντρώνονται με αντίστοιχες επιλεγμένες διαστάσεις και τα στοιχεία τους. Χάρη σε αυτά τα χαρακτηριστικά, τα σύνθετα ερωτήματα με πολυδιάστατα δεδομένα χρειάζονται πολύ λιγότερο χρόνο από ό,τι με σχεσιακές πηγές.

Ένας από τους κύριους προμηθευτές συστημάτων OLAP είναι η Microsoft Corporation. Ας δούμε την εφαρμογή των αρχών OLAP χρησιμοποιώντας πρακτικά παραδείγματα δημιουργίας αναλυτικού κύβου στις εφαρμογές Microsoft SQL Server Business Intelligence Development Studio (BIDS) και Microsoft Office PerformancePoint Server Planning Business Modeler (PPS) και ας εξοικειωθούμε με τις δυνατότητες οπτικής αναπαράστασης πολυδιάστατων δεδομένα με τη μορφή γραφημάτων, διαγραμμάτων και πινάκων.

Για παράδειγμα, στο BIDS είναι απαραίτητο να δημιουργηθεί ένας κύβος OLAP χρησιμοποιώντας δεδομένα σχετικά με μια ασφαλιστική εταιρεία, τους υπαλλήλους της, τους συνεργάτες (πελάτες) και τα σημεία πώλησης. Ας υποθέσουμε ότι η εταιρεία παρέχει έναν τύπο υπηρεσίας, επομένως δεν θα χρειαστεί μέτρηση των υπηρεσιών.

Πρώτα ας ορίσουμε τις μετρήσεις. Οι ακόλουθες οντότητες (κατηγορίες δεδομένων) σχετίζονται με τις δραστηριότητες της εταιρείας:

  • Σημεία πώλησης
    - Υπαλλήλους
    - Συνεργάτες
Δημιουργεί επίσης τις διαστάσεις Χρόνος και Σενάριο, που απαιτούνται για κάθε κύβο.
Στη συνέχεια, χρειάζεστε έναν πίνακα για την αποθήκευση γεγονότων (πίνακας δεδομένων).
Οι πληροφορίες μπορούν να εισαχθούν σε πίνακες με μη αυτόματο τρόπο, αλλά ο πιο συνηθισμένος τρόπος είναι η φόρτωση δεδομένων χρησιμοποιώντας τον Οδηγό εισαγωγής από διάφορες πηγές.
Το παρακάτω σχήμα δείχνει τη ροή της μη αυτόματης δημιουργίας και συμπλήρωσης πινάκων διαστάσεων και γεγονότων:

Εικ.1. Πίνακες διαστάσεων και γεγονότων στην αναλυτική βάση δεδομένων. Ακολουθία δημιουργίας
Αφού δημιουργήσετε μια πολυδιάστατη πηγή δεδομένων στο BIDS, μπορείτε να προβάλετε την παρουσίασή της (Προβολή πηγής δεδομένων). Στο παράδειγμά μας, θα πάρουμε το κύκλωμα που φαίνεται στο παρακάτω σχήμα.


Εικ.2. Προβολή πηγής δεδομένων στο Business Intelligence Development Studio (BIDS)

Όπως μπορείτε να δείτε, ο πίνακας γεγονότων συνδέεται με τους πίνακες διαστάσεων μέσω μιας αντιστοιχίας ενός προς ένα πεδίων αναγνωριστικού (PartnerID, EmployeeID, κ.λπ.).

Ας δούμε το αποτέλεσμα. Στην καρτέλα cube explorer, σύροντας μέτρα και διαστάσεις στα πεδία σύνολα, σειρές, στήλες και φίλτρα, μπορούμε να πάρουμε μια προβολή των δεδομένων που μας ενδιαφέρουν (για παράδειγμα, συναλλαγές σε ασφαλιστήρια συμβόλαια που συνήφθησαν από έναν συγκεκριμένο υπάλληλο το 2005).