Çok boyutlu veri analizi kavramı, OLAP sistemleri kullanılarak gerçekleştirilen operasyonel analizle yakından ilişkilidir.
OLAP (Çevrimiçi Analitik İşleme), karar verme süreçlerini desteklemek için çok boyutlu verileri toplamak, depolamak ve analiz etmek için yöntemler ve araçlar kullanan operasyonel analitik veri işlemeye yönelik bir teknolojidir.
OLAP sistemlerinin temel amacı analitik faaliyetleri ve kullanıcı analistlerinden gelen keyfi (geçici terim sıklıkla kullanılır) istekleri desteklemektir. OLAP analizinin amacı ortaya çıkan hipotezleri test etmektir.
OLAP teknolojisinin kökeninde ilişkisel yaklaşımın kurucusu E. Codd bulunmaktadır. 1993 yılında "Kullanıcı Analistleri için OLAP: Ne Olmalı?" başlıklı bir makale yayınladı. Bu belge, çevrimiçi analitiğin temel kavramlarını ana hatlarıyla özetlemekte ve çevrimiçi analitiği mümkün kılan ürünlerin karşılaması gereken aşağıdaki 12 gereksinimi tanımlamaktadır. Tokmakov G.P. Veri tabanı. Veritabanı kavramı, ilişkisel veri modeli, SQL dilleri. S.51
Aşağıda OLAP'ı tanımlayan Codd tarafından özetlenen 12 kural listelenmiştir.
1. Çok boyutluluk - kavramsal düzeydeki bir OLAP sistemi, verileri analiz süreçlerini ve bilginin algılanmasını basitleştiren çok boyutlu bir model biçiminde sunmalıdır.
2. Şeffaflık - OLAP sistemi, çok boyutlu modelin gerçek uygulamasını, organizasyon yöntemini, kaynakları, işleme ve depolama araçlarını kullanıcıdan gizlemelidir.
3. Kullanılabilirlik -- Bir OLAP sistemi kullanıcıya tek, tutarlı ve bütünsel bir veri modeli sunarak, nasıl ve nerede depolandığına bakılmaksızın verilere erişim sağlamalıdır.
4. Rapor geliştirirken tutarlı performans - Analizin gerçekleştirildiği boyutların sayısı arttıkça OLAP sistemlerinin performansı önemli ölçüde azalmamalıdır.
5. İstemci-sunucu mimarisi - OLAP sistemi istemci-sunucu ortamında çalışabilmelidir çünkü Günümüzde operasyonel analitik işleme tabi tutulması gereken verilerin çoğu, dağıtılmış olarak depolanmaktadır. Buradaki ana fikir, OLAP aracının sunucu bileşeninin yeterince akıllı olması ve kurumsal veritabanlarının çeşitli mantıksal ve fiziksel şemalarının şeffaflık etkisini sağlayacak şekilde genelleştirilmesine ve birleştirilmesine dayalı ortak bir kavramsal şema oluşturulmasına olanak sağlamasıdır.
6. Boyutsal eşitlik -- OLAP sistemi, tüm boyutların eşit olduğu çok boyutlu bir modeli desteklemelidir. Eğer gerekliyse ek özellikler bireysel boyutlara verilebilir, ancak bu yeteneğin herhangi bir boyuta verilmesi gerekir.
7. Seyrek matrislerin dinamik yönetimi - OLAP sistemi seyrek matrislerin optimum şekilde işlenmesini sağlamalıdır. Erişim hızı, veri hücrelerinin konumundan bağımsız olarak korunmalı ve farklı boyut sayılarına ve farklı derecelerde veri seyrekliğine sahip modeller için sabit olmalıdır.
8. Çok kullanıcılı mod desteği - OLAP sistemi, birden fazla kullanıcının tek bir analitik modelle birlikte çalışmasına veya onlar için tek verilerden farklı modeller oluşturmasına olanak sağlamalıdır. Bu durumda verinin hem okunması hem de yazılması mümkün olduğundan sistemin bütünlüğünü ve güvenliğini sağlaması gerekir.
9. Sınırsız çapraz işlemler - OLAP sistemi, herhangi bir dilimleme, döndürme, birleştirme veya detaya inme işlemleri gerçekleştirilirken, hiperküpün hücreleri arasında belirli bir resmi dil kullanılarak tanımlanan işlevsel ilişkilerin korunmasını sağlamalıdır. Sistem, kullanıcının yeniden tanımlamasına gerek kalmadan, kurulan ilişkilerin dönüşümünü bağımsız (otomatik) olarak gerçekleştirmelidir.
10. Sezgisel veri manipülasyonu - Bir OLAP sistemi, kullanıcının çok fazla arayüz manipülasyonu yapmasına gerek kalmadan bir hiperküp üzerinde dilimleme, döndürme, birleştirme ve delme işlemlerini gerçekleştirmenin bir yolunu sağlamalıdır. Analitik modelde tanımlanan boyutların yukarıdaki işlemleri gerçekleştirmek için gerekli tüm bilgileri içermesi gerekir.
11. Rapor almak için esnek seçenekler - OLAP sistemi çeşitli veri görselleştirme yöntemlerini desteklemelidir; Raporlar mümkün olan her yönde sunulmalıdır. Raporlama araçları, sentezlenmiş verileri veya veri modelinden kaynaklanan bilgileri olası herhangi bir yönde sunmalıdır. Bu, satırların, sütunların veya sayfaların aynı anda 0'dan N'ye kadar boyut göstermesi gerektiği anlamına gelir; N--sayı analitik modelin tamamının ölçümleri. Ek olarak, tek bir gönderide, sütunda veya sayfada gösterilen her içerik boyutu, boyutta yer alan öğelerin (değerlerin) herhangi bir alt kümesinin herhangi bir sırayla gösterilmesine izin vermelidir.
12. Sınırsız boyut ve toplama düzeyi sayısı - analitik modelde gerekli olan gerekli boyutların olası sayısı üzerine yapılan araştırma, 19'a kadar boyutun aynı anda kullanılabileceğini gösterdi. Bu nedenle analitik aracın aynı anda en az 15 ve tercihen 20 ölçüm sağlayabilmesi şiddetle tavsiye edilir. Ayrıca, ortak boyutların her biri, kullanıcı analistinin tanımladığı toplama düzeyleri ve birleştirme yollarının sayısıyla sınırlı olmamalıdır.
Codd'un Ek Kuralları.
OLAP'ın fiili tanımı olarak hizmet eden bu gereksinimler kümesi, sıklıkla çeşitli şikayetlere neden olur; örneğin, 1, 2, 3, 6 numaralı kurallar gereksinimlerdir ve 10, 11 numaralı kurallar resmileştirilmemiş isteklerdir. Tokmakov G.P. Veri tabanı. Veritabanı kavramı, ilişkisel veri modeli, SQL dilleri. S.68 Dolayısıyla Codd'un listelediği 12 gereksinim, OLAP'ı doğru şekilde tanımlamamıza izin vermiyor. 1995 yılında Codd yukarıdaki listeye aşağıdaki altı kuralı ekledi:
13. Toplu Alma ve Yorumlama -- Bir OLAP sistemi hem kendi verilerine hem de harici verilere eşit derecede etkili bir şekilde erişim sağlamalıdır.
14. Tüm OLAP analiz modelleri için destek -- Bir OLAP sistemi, Codd tarafından tanımlanan dört veri analizi modelinin tümünü desteklemelidir: kategorik, yorumlayıcı, spekülatif ve basmakalıp.
15. Normalleştirilmemiş verilerin işlenmesi - OLAP sistemi normalleştirilmemiş veri kaynaklarıyla entegre edilmelidir. OLAP ortamında yapılan veri değişiklikleri, orijinal harici sistemlerde depolanan verilerde değişiklik yapılmasına neden olmamalıdır.
16. OLAP sonuçlarını kaydetme: bunları kaynak verilerden ayrı olarak depolama - okuma-yazma modunda çalışan bir OLAP sistemi, kaynak verileri değiştirdikten sonra sonuçları ayrı olarak kaydetmelidir. Yani orijinal verinin güvenliği sağlanır.
17. Eksik değerlerin ortadan kaldırılması - Bir OLAP sistemi, kullanıcıya veri sunarken tüm eksik değerleri atmalıdır. Yani eksik değerlerin null değerlerden farklı olması gerekir.
18. Eksik Değerlerin Ele Alınması -- OLAP sistemi, kaynaklarına bakılmaksızın tüm eksik değerleri göz ardı etmelidir. Bu özellik 17. kuralla ilgilidir.
Ayrıca Codd, 18 kuralın tamamını özellikler olarak adlandırarak aşağıdaki dört gruba ayırdı. Bu gruplar B, S, R ve D olarak adlandırıldı.
(B)'nin ana özellikleri aşağıdaki kuralları içerir:
Verilerin çok boyutlu kavramsal gösterimi (kural 1);
Sezgisel veri manipülasyonu (kural 10);
Kullanılabilirlik (kural 3);
Toplu çıkarma ve yorumlama (kural 13);
Tüm OLAP analiz modelleri için destek (kural 14);
İstemci-sunucu mimarisi (kural 5);
Şeffaflık (kural 2);
Çoklu kullanıcı desteği (kural 8)
Özel Özellikler (S):
Normalleştirilmemiş verilerin işlenmesi (kural 15);
OLAP sonuçlarının saklanması: bunların kaynak veriden ayrı olarak saklanması (kural 16);
Eksik değerlerin giderilmesi (kural 17);
Eksik değerlerin ele alınması (kural 18). Raporlama Özellikleri (R):
Raporlamada esneklik (kural 11);
Standart raporlama performansı (kural 4);
Otomatik fiziksel katman yapılandırması (değiştirilmiş orijinal kural 7).
Boyut Kontrolü (D):
Ölçümlerin evrenselliği (kural 6);
Sınırsız sayıda boyut ve toplama düzeyi (kural 12);
Boyutlar arasında sınırsız işlem (kural 9).
OLAP teknolojisi kavramı 1993 yılında Edgar Codd tarafından formüle edildi.
Bu teknoloji, OLAP küpleri adı verilen çok boyutlu veri kümelerinin oluşturulmasına dayanmaktadır (tanımdan da anlaşılabileceği gibi mutlaka üç boyutlu olması gerekmez). OLAP teknolojilerini kullanmanın amacı, verileri analiz etmek ve bu analizi yönetim personelinin anlayabileceği ve bunlara dayanarak karar vermesine uygun bir biçimde sunmaktır.
Çok değişkenli analiz uygulamaları için temel gereksinimler:
OLAP sistem araçları, verileri belirtilen koşullara göre sıralama ve seçme yeteneği sağlar. Çeşitli niteliksel ve niceliksel koşullar belirtilebilir.
Veritabanlarını oluşturmak ve sürdürmek için kullanılan çok sayıda araçta (DBMS) kullanılan ana veri modeli ilişkisel modeldir. İçindeki veriler, anahtar alanlarla birbirine bağlanan bir dizi iki boyutlu ilişki tablosu biçiminde sunulur. Tekrarlamayı, tutarsızlığı ortadan kaldırmak ve veritabanlarının bakımında işçilik maliyetlerini azaltmak için varlık tablolarını normalleştirmeye yönelik resmi bir aygıt kullanılır. Bununla birlikte, bellek kaynakları kaydedilmesine rağmen kullanımı, veritabanı sorgularına yanıt oluşturmak için harcanan ek süre ile ilişkilidir.
Çok boyutlu bir veri modeli, incelenmekte olan nesneyi çok boyutlu bir küp biçiminde temsil eder; üç boyutlu bir model daha sık kullanılır. Boyutlar veya nitelik ayrıntıları küpün eksenleri veya yüzleri boyunca çizilir. Temel nitelikler küp hücrelerinin doldurulmasıdır. Çok boyutlu bir küp, bir karar destek sisteminde analitik çalışma materyallerine dayalı raporlama ve analitik belgeler ve multimedya sunumları oluştururken algıyı ve sunumu kolaylaştırmak amacıyla üç boyutlu küplerin bir kombinasyonu ile temsil edilebilir.
OLAP teknolojileri çerçevesinde, verilerin çok boyutlu temsilinin hem ilişkisel DBMS'ler hem de çok boyutlu özel araçlar aracılığıyla düzenlenebileceği gerçeğine dayanarak, üç tür çok boyutlu OLAP sistemi ayırt edilir:
Çok boyutlu DBMS'lerde, veriler ilişkisel tablolar biçiminde değil, depolanan tüm verilerin aynı boyuta sahip olması gerektiğinde, hiperküp biçiminde sıralı çok boyutlu diziler biçiminde düzenlenir; bu, maksimum değerin oluşturulması gerektiği anlamına gelir. tam temelölçümler. Veriler çoklu küp şeklinde düzenlenebilir; bu seçenekte her göstergenin değerleri kendi boyutlarıyla birlikte saklanır ve veri işleme sistemin kendi aracı tarafından gerçekleştirilir. Bu durumda depolama yapısı basitleştirilmiştir çünkü çok boyutlu veya nesne odaklı bir veri depolama alanına ihtiyaç duyulmaz. Verileri ilişkisel bir modelden nesne modeline dönüştürmek için modeller ve sistemler oluşturmaya yönelik büyük işçilik maliyetleri azalır.
MOLAP'ın avantajları şunlardır:
MOLAP'ın sınırlamaları şunları içerir:
Çok boyutlu veri oluşturmaya yönelik işçilik maliyetleri hızla artıyor çünkü... Bu durumda, bilgi deposunda bulunan verilerin ilişkisel modelini somutlaştırmanın neredeyse hiçbir özel yolu yoktur. Sorgu yanıt süreleri çoğu zaman OLAP sistemlerinin gereksinimlerini karşılayamaz.
ROLAP sistemlerinin avantajları şunlardır:
ROLAP sistemlerinin dezavantajı, düşük üretkenlik, veritabanı şemalarının dikkatli bir şekilde geliştirilmesi ihtiyacı, dizinlerin özel ayarlanması, sorgu istatistiklerinin analizi ve veritabanı şemalarını değiştirirken analiz bulgularının dikkate alınmasıdır; bu da önemli ölçüde ek işçilik maliyetlerine yol açar.
Bu koşulların yerine getirilmesi, ROLAP sistemlerini kullanırken erişim süresi açısından MOLAP sistemlerine benzer göstergeler elde etmenin yanı sıra bellek tasarrufunda da bunları aşmanıza olanak tanır.
Hibrit OLAP sistemleri, ilişkisel ve çok boyutlu bir veri modelini uygulayan araçların birleşimidir. Bu, böyle bir modelin oluşturulması ve sürdürülmesinin kaynak maliyetlerini ve isteklere yanıt süresini önemli ölçüde azaltmanıza olanak tanır.
Bu yaklaşım, ilk iki yaklaşımın avantajlarını kullanır ve dezavantajlarını telafi eder. En gelişmiş durumda yazılım ürünleri Bu amaçla bu prensip uygulanır.
OLAP sistemlerinde hibrit mimarinin kullanılması, çok boyutlu analizlerde yazılım araçlarının kullanımıyla ilgili problemleri çözmenin en uygun yoludur.
Desen algılama modu akıllı veri işlemeyi temel alır. Buradaki asıl görev, incelenen süreçlerdeki kalıpları, çeşitli faktörlerin ilişkilerini ve karşılıklı etkilerini belirlemek, büyük "olağandışı" sapmaları araştırmak ve çeşitli önemli süreçlerin gidişatını tahmin etmektir. Bu alan veri madenciliği ile ilgilidir.
OLAP mekanizması günümüzün popüler veri analizi yöntemlerinden biridir. Bu sorunu çözmek için iki ana yaklaşım vardır. Bunlardan ilkine Çok Boyutlu OLAP (MOLAP) adı verilir - sunucu tarafında çok boyutlu bir veritabanı kullanan mekanizmanın uygulanması ve ikincisi İlişkisel OLAP (ROLAP) - dayalı olarak anında küpler oluşturma SQL sorguları ilişkisel bir DBMS'ye. Bu yaklaşımların her birinin artıları ve eksileri vardır. Onların Karşılaştırmalı analiz bu makalenin kapsamı dışındadır. Masaüstü ROLAP modülünün çekirdeğine ilişkin uygulamamızı açıklayacağız.
Bu görev, Borland Delphi'de bulunan Karar Küpü bileşenleri temel alınarak oluşturulmuş bir ROLAP sistemi kullanıldıktan sonra ortaya çıktı. Ne yazık ki, bu bileşen grubunun kullanımı büyük miktarda veri üzerinde düşük performans gösterdi. Bu sorun, küplere beslemeden önce mümkün olduğu kadar çok veriyi keserek hafifletilebilir. Ancak bu her zaman yeterli değildir.
OLAP sistemleri hakkında internette ve basında pek çok bilgi bulabilirsiniz, ancak içeride nasıl çalıştığına dair neredeyse hiçbir yerde söylenmiyor. Bu nedenle çoğu sorunun çözümü bize deneme yanılma yoluyla verildi.
Bir masaüstü OLAP sisteminin genel çalışma şeması aşağıdaki gibi gösterilebilir:
Çalışma algoritması aşağıdaki gibidir:
Nasıl olduğunu düşünelim benzer sistem içeride düzenlenebilir. Bunu görülebilen ve dokunulabilen taraftan yani ekranlardan başlatacağız.
OLAP sistemlerinde kullanılan ekranlar çoğunlukla iki türde gelir: çapraz sekmeler ve grafikler. Bir küpü görüntülemenin temel ve en yaygın yolu olan çapraz tabloya bakalım.
Aşağıdaki şekilde, toplu sonuçları içeren satırlar ve sütunlar sarı renkte, gerçekleri içeren hücreler açık gri renkte ve boyutsal verileri içeren hücreler koyu gri renkte gösterilmiştir.
Böylece tablo, gelecekte üzerinde çalışacağımız aşağıdaki öğelere ayrılabilir:
Matrisi gerçeklerle doldururken şu şekilde ilerlememiz gerekir:
Ortaya çıkan matrisin çok seyrek olacağına dikkat edilmelidir, bu nedenle iki boyutlu bir dizi biçimindeki organizasyonu (yüzeyde yatan seçenek) sadece mantıksız değil, aynı zamanda büyük olasılıkla imkansız olduğu için de imkansızdır. Bu matrisin boyutu, hacmi olmayan depolama için yeterlidir rasgele erişim belleği. Örneğin, küpümüz bir yıllık satışlarla ilgili bilgi içeriyorsa ve yalnızca 3 boyutu varsa: Müşteriler (250), Ürünler (500) ve Tarih (365), o zaman aşağıdaki boyutlardan oluşan bir olgu matrisi elde ederiz:
Eleman sayısı = 250 x 500 x 365 = 45.625.000
Ve bu, matriste sadece birkaç bin dolu elemanın bulunabilmesine rağmen. Ayrıca boyut sayısı arttıkça matris daha seyrek olacaktır.
Bu nedenle, bu matrisle çalışmak için seyrek matrislerle çalışmaya yönelik özel mekanizmalar kullanmanız gerekir. Seyrek bir matrisi düzenlemek için çeşitli seçenekler mümkündür. Programlama literatüründe, örneğin Donald Knuth'un "Programlama Sanatı" adlı klasik kitabının ilk cildinde oldukça iyi anlatılmıştır.
Şimdi bir gerçeğin koordinatlarını, ona karşılık gelen boyutları bilerek nasıl belirleyebileceğimizi düşünelim. Bunu yapmak için başlık yapısına daha yakından bakalım:
Bu durumda karşılık gelen hücrenin sayılarını ve düştüğü toplamları belirlemenin bir yolunu kolayca bulabilirsiniz. Burada çeşitli yaklaşımlar önerilebilir. Bunlardan biri eşleşen hücreleri bulmak için bir ağaç kullanmaktır. Bu ağaç seçimin üzerinden geçilerek oluşturulabilir. Ayrıca gerekli koordinatı hesaplamak için analitik bir yineleme formülü kolaylıkla tanımlanabilir.
Tabloda saklanan verilerin kullanılabilmesi için dönüştürülmesi gerekir. Bu nedenle, bir hiperküp oluştururken performansı artırmak için küpün boyutları olan sütunlarda depolanan benzersiz öğelerin bulunması arzu edilir. Ayrıca, aynı boyut değerlerine sahip kayıtlar için olguların ön toplamasını gerçekleştirebilirsiniz. Yukarıda da belirttiğimiz gibi bizim için önemli. benzersiz değerler, ölçüm alanlarında mevcuttur. Daha sonra bunları depolamak için aşağıdaki yapı önerilebilir:
Bu yapıyı kullanarak bellek gereksinimini önemli ölçüde azaltıyoruz. Bu oldukça alakalı, çünkü... Çalışma hızını artırmak için verilerin RAM'de saklanması tavsiye edilir. Ek olarak, yalnızca bir dizi öğeyi saklayabilir ve değerlerini diske aktarabilirsiniz, çünkü bunlara yalnızca çapraz tabloyu görüntülerken ihtiyacımız olacak.
Yukarıda açıklanan fikirler CubeBase bileşen kitaplığının oluşturulmasının temelini oluşturdu.
TCubeKaynağı Verilerin önbelleğe alınmasını ve dahili bir formata dönüştürülmesini ve ayrıca verilerin ön toplanmasını gerçekleştirir. Bileşen TCubeEngine hiperküpün hesaplamalarını ve onunla işlemleri gerçekleştirir. Aslında düz bir tabloyu çok boyutlu bir veri setine dönüştüren bir OLAP motorudur. Bileşen TCubeGridçapraz tabloyu görüntüler ve hiperküpün görüntüsünü kontrol eder. TCubeChart hiperküpü grafikler biçiminde görmenizi sağlar ve bileşen TCubePivote küp çekirdeğinin çalışmasını kontrol eder.
Bu bileşen seti Decision Cube'dan çok daha yüksek performans gösterdi. Yani 45 bin kayıttan oluşan bir sette Karar Küpü bileşenleri 8 dakikaya ihtiyaç duyuyordu. bir pivot tablo oluşturmak için. CubeBase verileri 7 saniyede yükledi. ve 4 saniyede bir pivot tablo oluşturmak. 700 bin Decision Cube kaydı üzerinde test yaparken 30 dakika içinde yanıt alamadık ve ardından görevi iptal ettik. CubeBase verileri 45 saniyede yükledi. ve 15 saniyede bir küp inşa etmek.
Binlerce kayıttan oluşan veri hacimlerinde CubeBase, Decision Cube'dan onlarca kat daha hızlı işlem yaptı. Yüzbinlerce kaydın bulunduğu tablolarda - yüzlerce kat daha hızlı. Yüksek performans ise OLAP sistemlerinin en önemli göstergelerinden biridir.
Raporun amacı
Bu rapor, kullanışlı bir analitik araç olan akıllı teknoloji kategorilerinden biri olan OLAP teknolojilerine odaklanacaktır.
Raporun amacı: 2 konuyu ortaya çıkarmak ve vurgulamak: 1) OLAP kavramı ve bunların finansal yönetimde uygulamalı önemi; 2) OLAP işlevselliğinin uygulanması Yazılım çözümleri: farklılıklar, fırsatlar, avantajlar, dezavantajlar.
OLAP'ın sadece finans alanında değil (raporun başlığından da anlaşılacağı gibi) her türlü uygulama alanında kullanılabilecek, çeşitli yöntemler kullanılarak veri analizi gerektiren evrensel bir araç olduğunu hemen belirtmek isterim.
Finansal Yönetim
Finansal yönetim, analizin diğerlerinden daha önemli olduğu bir alandır. Herhangi bir mali ve yönetim kararı, belirli analitik prosedürlerin bir sonucu olarak ortaya çıkar. Günümüzde bir işletmenin başarılı işleyişi için finansal yönetim önem kazanmaktadır. Finansal yönetim bir işletmede yardımcı bir süreç olmasına rağmen hatalı finansal ve yönetimsel kararlar büyük kayıplara yol açabileceğinden özel dikkat gerektirir.
Finansal yönetim, optimum dağıtım yoluyla kullanımlarından maksimum etkiyi elde etmek için işletmeye gerekli hacimlerde, doğru zamanda ve doğru yerde finansal kaynak sağlamayı amaçlamaktadır.
“Maksimum kaynak verimliliği” düzeyini tanımlamak belki zordur, ancak her durumda,
CFO her zaman şunları bilmelidir:
Bu sorulara makul cevaplar alabilmek için yeterince fazla sayıda performans göstergesine sahip olmak, analiz etmek ve nasıl analiz edileceğini bilmek gerekir. Ayrıca FU çok sayıda alanı kapsamaktadır: nakit akışlarının analizi (hareketler) Para), varlık ve yükümlülüklerin analizi, karlılık analizi, marjinal analiz, karlılık analizi, ürün çeşitliliği analizi.
Bilgi
Bu nedenle, finansal yönetim sürecinin etkinliğinde önemli bir faktör bilginin mevcudiyetidir:
Birincisi, bu finansörün (veya bu çalışanı işe alan İK yöneticisinin) eylemlerinin kapsamına giriyorsa, ikincisi, finans ve bilgi hizmetleri çalışanlarının ortak çabaları tarafından kuruluşta bilinçli olarak yaratılmalıdır.
Şimdi orada ne var
Ancak artık işletmelerde paradoksal bir durum tipiktir: Bilgi var, çok fazla, çok fazla. Ancak kaotik bir durumda: yapılandırılmamış, tutarsız, parçalanmış, her zaman güvenilir değil ve çoğu zaman hatalı, bulmak ve elde etmek neredeyse imkansız. İç yönetim için değil, dış düzenleyici otoritelere sunulmak üzere oluşturulduğundan, finansal analiz için uygun olmayan ve anlaşılması zor olan, uzun ve çoğu zaman işe yaramaz bir dağlar kadar mali tablo gerçekleştirilir.
Şirketin yaptığı araştırma sonuçlarına göre Reuters 1.300 uluslararası yönetici arasında ankete katılanların %38'i ihtiyaç duydukları bilgiyi bulmak için çok zaman harcadıklarını söylüyor. Yüksek nitelikli bir uzmanın, veri analizine değil, bu analiz için gerekli bilgilerin toplanmasına, aranmasına ve sistemleştirilmesine yüksek miktarda zaman harcadığı ortaya çıktı. Aynı zamanda yöneticiler çoğu zaman alakasız verilerle aşırı yükleniyor ve bu da yine işlerinin verimliliğini azaltıyor. Bu durumun nedeni; bilgi fazlalığı ve bilgi eksikliğidir.
Ne yapalım
Bilginin bilgiye dönüştürülmesi gerekiyor. Modern işletmeler için değerli bilgiler, bunların sistematik olarak edinilmesi, sentezi, değişimi, kullanımı bir tür para birimidir, ancak onu almak için herhangi bir iş süreci gibi bilgiyi yönetmek gerekir.
Bilgi yönetiminin anahtarı, doğru bilgiyi, doğru biçimde, kuruluş içindeki paydaşlara doğru zamanda ulaştırmaktır. Böyle bir yönetimin amacı, artan miktarda bilgiyi kullanarak insanların birlikte daha iyi çalışmasına yardımcı olmaktır.
Bu durumda bilgi teknolojisi, bir kuruluştaki bilgileri sistematikleştirmenin, belirli kullanıcılara erişim sağlamanın ve onlara bu bilgiyi bilgiye dönüştürmeleri için araçlar vermenin mümkün olabileceği bir araç görevi görür.
OLAP teknolojileri (İngilizce Çevrimiçi Analitik İşleme'den), belirli bir ürünün değil, bir depoda biriken çok boyutlu verilerin operasyonel analizine yönelik tüm teknolojinin adıdır. OLAP'ın özünü anlamak için, karar verme amacıyla bilgi edinmenin geleneksel sürecini dikkate almak gerekir.
Burada elbette birçok seçenek de olabilir: tam bilgi kaosu veya işletmenin belirli operasyonlara ilişkin gerçeklerin veritabanlarına kaydedilip saklandığı operasyonel sistemlere sahip olduğu en tipik durum. Analitik amaçlarla veritabanlarından veri çıkarmak amacıyla belirli veri örneklerine yönelik bir sorgulama sistemi oluşturulmuştur.
Ancak bu karar destek yöntemi esneklikten yoksundur ve birçok dezavantaja sahiptir:
Sorgu raporları tek boyutlu bir formatta sunuluyorsa iş sorunları genellikle çok boyutlu ve çok yönlüdür. Bir şirketin işinin net bir resmini elde etmek istiyorsanız verileri çeşitli açılardan analiz etmeniz gerekir.
Pek çok şirket, kendi başına piyasa olaylarına hızlı veya yeterince yetkin bir yanıt sağlamayan, dağlar kadar kullanılmayan bilgiyi ideal şekilde organize eden mükemmel ilişkisel veritabanları oluşturur. EVET - ilişkisel veritabanları kurumsal verileri depolamak için en uygun teknolojiydi, öyledir ve öyle kalacaktır. bu konuyla ilgili değil yeni teknoloji DB'den ziyade, mevcut DBMS'lerin işlevlerini tamamlayan ve sağlayacak ve otomatikleştirecek kadar esnek olan analiz araçları hakkındadır. farklı şekiller OLAP'ın doğasında olan entelektüel analiz.
OLAP ne sağlar?
OLAP teknolojilerini kullanmanın etkisini elde etmek için şunları yapmalısınız: 1) teknolojilerin özünü ve yeteneklerini anlayın; 2) hangi süreçlerin analiz edilmesi gerektiğini, hangi göstergelerle karakterize edileceğini ve bunları hangi boyutlarda görmenin tavsiye edildiğini açıkça tanımlayın, yani. bir analiz modeli oluşturun.
OLAP teknolojilerinin üzerinde çalıştığı temel kavramlar şunlardır:
Verilerin çok boyutluluğunu anlamak için öncelikle Kurumsal Maliyetlerin ekonomik unsurlara ve iş birimlerine göre performansını gösteren bir tablo sunmalısınız.
Bu veriler iki boyutta sunulmaktadır:
Bu tablo, belirli bir döneme ait satışları gösterdiğinden bilgilendirici değildir. Farklı zaman dilimleri için analistlerin çeşitli tabloları karşılaştırması gerekecektir (her bir zaman dilimi için):
Şekilde ilk iki boyuta ek olarak 3. boyut olan Zaman gösterilmektedir. (Makale, iş birimi)
Çok boyutlu verileri göstermenin başka bir yolu da onu küp biçiminde temsil etmektir:
OLAP küpleri, analistlerin iş tarafından sorulan sorulara yanıtlar elde etmek için çeşitli dilimlerde veri elde etmesine olanak tanır:
Bu tür soruların yanıtları yönetim kararları vermek için gereklidir: belirli maliyet kalemlerinin azaltılması, yapıları üzerindeki etkisi, zaman içinde maliyetlerde meydana gelen değişikliklerin nedenlerinin belirlenmesi, plandan sapmalar ve bunların ortadan kaldırılması - yapılarının optimize edilmesi.
Bu örnekte yalnızca 3 boyut dikkate alınmıştır. 3 boyuttan fazlasını tasvir etmek zordur ancak 3 boyutla aynı şekilde çalışır.
Tipik olarak OLAP uygulamaları 3 veya daha fazla boyuta ilişkin veri elde etmenize olanak tanır; örneğin, bir boyut daha ekleyebilirsiniz - Plan-Fiili, Maliyet Kategorisi: doğrudan, dolaylı, Siparişlere göre, Aylara göre. Ek boyutlar, daha analitik dilimler elde etmenize ve birden fazla koşula sahip sorulara yanıt vermenize olanak tanır.
OLAP ayrıca analistlerin her boyutu, tüm organizasyon genelindeki ölçümü yansıtan bir grup, alt grup ve toplam hiyerarşisi halinde organize etmelerine olanak tanır; bu, bir işletmeyi analiz etmenin en mantıklı yoludur.
Örneğin, maliyetleri hiyerarşik olarak gruplamak tavsiye edilir:
OLAP, analistlerin genel özet metriğine (en üst düzeyde) bakmasına ve ardından metriğin neden değiştiğinin kesin nedenini keşfetmek için alt ve sonraki düzeylere inmesine olanak tanır.
OLAP, analistlerin boyutları hiyerarşik olarak oluşturma yeteneğiyle birlikte bir veri küpünde birden fazla boyut kullanmasına olanak tanıyarak, işin bilgi ambarı yapısı tarafından sıkıştırılmayan bir resmini sağlar.
Kural olarak, kavramlarla çalışırlar: sütunlarda belirtilen boyutlar, satırlar (birkaç tane olabilir), geri kalan form dilimleri, tablonun içeriği form boyutları (satışlar, maliyetler, nakit)
Tipik olarak OLAP, küp boyutlarının yönünü değiştirmenize ve böylece verileri farklı görünümlerde sunmanıza olanak tanır.
Küp verilerinin görüntülenmesi şunlara bağlıdır:
Böylece OLAP, çeşitli analiz türlerini gerçekleştirmenize ve bunların sonuçlarıyla ilişkilerini anlamanıza olanak tanır.
Yeterlik: OLAP'ın psikoloji yasalarına dayandığını söyleyebiliriz: bilgi taleplerini "gerçek zamanlı" olarak işleme yeteneği - verilerin kullanıcı tarafından analitik olarak anlaşılması sürecinin hızında.
İlişkisel bir veritabanı saniyede yaklaşık 200 kayıt okuyabiliyor ve 20 kayıt yazabiliyorsa, iyi bir OLAP sunucusu, hesaplanan satırları ve sütunları kullanarak saniyede 20.000-30.000 hücreyi (ilişkisel veritabanındaki bir kayda eşdeğer) birleştirebilir.
Görünürlük: OLAP'ın son kullanıcıya verilerin grafiksel sunumu için gelişmiş araçlar sağladığı vurgulanmalıdır. İnsan beyni, alfasayısal biçimde sunulan bilgilerden birkaç kat daha büyük bir hacimde geometrik görüntüler biçiminde sunulan bilgileri algılama ve analiz etme yeteneğine sahiptir. Örnek: Diyelim ki yüz fotoğraftan birinde tanıdık bir yüz bulmanız gerekiyor. Bu sürecin sizi bir dakikadan fazla sürmeyeceğine inanıyorum. Şimdi, fotoğraflar yerine aynı kişilerin yüzlerce sözlü tanımının size sunulacağını hayal edin. Önerilen sorunu hiçbir şekilde çözemeyeceğinizi düşünüyorum.
Basitlik: Bu teknolojilerin temel özelliği, alanında uzman olmayan kişilerin kullanımına yönelik olmalarıdır. Bilişim Teknolojileri uzman bir istatistikçi değil, uygulamalı alanda bir profesyonel - bir kredi departmanı yöneticisi, bir bütçe departmanı yöneticisi ve son olarak bir direktör. Analistin bilgisayarla değil sorunla iletişim kurması için tasarlanmıştır..
OLAP'ın büyük yeteneklerine rağmen (ayrıca fikir nispeten eskidir - 60'lar), gerçek kullanımı işletmelerimizde neredeyse hiç bulunmaz. Neden?
OLAP kullanımına yönelik yaklaşımımız ve Batılı yaklaşımlar
Ek olarak, OLAP'ın teknolojik yeteneklerini anlarken bile uygulama faydasına ilişkin özel bir anlayışa da sahibiz.
OLAP'a ayrılmış çeşitli materyallerin yazarları ve Rus yazarlarımız, OLAP'ın kullanışlılığı hakkında şu görüşleri ifade ediyorlar: çoğu, OLAP'ı, verileri basit ve rahat bir şekilde genişletmenize ve daraltmanıza olanak tanıyan, analiz sırasında analistin aklına gelen manipülasyonları gerçekleştiren bir araç olarak algılıyor. analiz süreci. Analist ne kadar çok veri "dilim" ve "bölüm" görürse, o kadar çok fikre sahip olur ve bu da doğrulama için giderek daha fazla "dilim" gerektirir. Bu doğru değil.
OLAP'ın kullanışlılığına ilişkin Batılı anlayış, OLAP çözümlerini tasarlarken dahil edilmesi gereken metodolojik bir analiz modeline dayanmaktadır. Analist OLAP küpüyle oynamamalı ve boyutlarını ve ayrıntı düzeylerini, veri yönelimini, verilerin grafiksel gösterimini (ve bu gerçekten gerektirir!) amaçsızca değiştirmemeli, ancak hangi görüşlere, hangi sırayla ve neden ihtiyaç duyduğunu (tabii ki) açıkça anlamalıdır. , öğeler "burada keşifler olabilir, ancak bu OLAP'ın kullanışlılığı açısından temel değildir).
OLAP teknolojilerinin en verimli uygulama alanlarından biri. Bütçe analizi için OLAP araçları olmadan hiçbir modern bütçeleme sisteminin tamamlanmış sayılması boşuna değildir. Çoğu bütçe raporu OLAP sistemleri temel alınarak kolayca oluşturulur. Raporlar aynı zamanda çok çeşitli sorulara da yanıt veriyor: gider ve gelir yapısının analizi, farklı bölümlerdeki belirli kalemler için giderlerin karşılaştırılması, belirli kalemler için harcama dinamiklerinin ve eğilimlerinin analizi, maliyet ve analizlerin analizi. kar.
OLAP, akışlarını optimize etmek için ticari operasyonlar, karşı taraflar, para birimleri ve zaman bağlamında nakit girişlerini ve çıkışlarını analiz etmenize olanak tanır.
Uygun verilere sahipseniz OLAP teknolojisinin çeşitli uygulamalarını bulabilirsiniz.
Bu bölümde OLAP'ı bir yazılım çözümü olarak ele alacağız.
OLAP uygulamalarını uygulamanın pek çok yolu vardır; bu nedenle özel bir teknolojinin gerekli olmaması, hatta tavsiye edilmemesi gerekirdi. Farklı koşullar ve koşullar altında bir yaklaşım diğerine tercih edilebilir. Uygulama teknikleri, satıcıların gurur duyduğu birçok farklı özel fikri içerir: istemci-sunucu mimarisinin çeşitleri, zaman serisi analizi, nesne yönelimi, veri depolama optimizasyonu, paralel süreçler vb. Ancak bu teknolojiler OLAP tanımının bir parçası olamaz.
Tüm OLAP ürünlerinde (OLAP ürünü ise) teknolojinin ideali olan dikkat edilmesi gereken özellikler bulunmaktadır. Bunlar OLAP'ı (FASMI testi olarak adlandırılan) karakterize eden 5 temel tanımdır: Paylaşılan Çok Boyutlu Bilginin Hızlı Analizi.
Başka bir deyişle bu 5 temel tanım, OLAP ürünlerinin ulaşmak için tasarlandığı hedeflerdir.
Bir OLAP sistemi belirli bileşenleri içerir. Bu veya bu ürünün uygulayabileceği operasyonları için çeşitli planlar vardır.
Tipik olarak bir OLAP sistemi aşağıdaki bileşenleri içerir:
Tüm bileşenlerin gerekli olmadığına dikkat edilmelidir. Doğrudan kullanıcının bilgisayarında depolanan verileri analiz etmenize olanak tanıyan ve OLAP sunucusu gerektirmeyen masaüstü OLAP sistemleri bulunmaktadır.
Ancak gerekli olan unsur veri kaynağıdır: Veri kullanılabilirliği önemli bir konudur. Muhasebe sistemi veritabanında Excel tablosu gibi herhangi bir biçimde veya şubelerden gelen yapılandırılmış raporlar şeklinde mevcutsa, BT uzmanı OLAP sistemiyle doğrudan veya ara dönüşümle entegre olabilecektir. OLAP sistemlerinin bunun için özel araçları vardır. Bu veriler mevcut değilse veya yeterli düzeyde ve kalitede değilse OLAP yardımcı olmayacaktır. Yani OLAP veri üzerinde sadece bir üst yapıdır, yoksa işe yaramaz bir şey haline gelir.
OLAP uygulamalarına ilişkin verilerin çoğu diğer sistemlerden kaynaklanır. Ancak bazı uygulamalarda (örneğin planlama veya bütçeleme), veriler doğrudan OLAP uygulamalarında oluşturulabilir. Veriler diğer uygulamalardan geldiğinde, genellikle verilerin OLAP uygulaması için ayrı, kopya bir formda saklanması gerekir. Bu nedenle veri ambarlarının oluşturulması tavsiye edilir.
“OLAP” teriminin ayrılmaz bir şekilde “veri ambarı” (Veri Ambarı) terimiyle bağlantılı olduğuna dikkat edilmelidir. Veri ambarı, yönetimin karar verme sürecini desteklemek için alana özgü, zamana dayalı ve değişmez bir veri topluluğudur. Depodaki veriler, iş süreçlerini otomatikleştirmek için tasarlanmış operasyonel sistemlerden (OLTP sistemleri) gelir; depo, örneğin istatistiksel raporlar gibi harici kaynaklardan doldurulabilir.
Zaten veritabanlarında veya işletim sistemi dosyalarında bulunan açıkça gereksiz bilgileri içermelerine rağmen, veri ambarları aşağıdaki nedenlerden dolayı gereklidir:
Havuzun amacı analiz için “hammaddeleri” tek bir yerde ve basit, anlaşılır bir yapıda sağlamaktır. Yani Veri Ambarı kavramı bir veri analizi kavramı değil, verileri analize hazırlama kavramıdır. Tek bir entegre veri kaynağının uygulanmasını içerir.
OLAP ürünlerini kullanırken iki soru önemlidir: nasıl ve nerede kale Ve işlem veri. Bu iki sürecin nasıl uygulandığına bağlı olarak OLAP mimarileri birbirinden ayrılır. OLAP için veri depolamanın 3 yolu ve bu veriyi işlemenin 3 yolu vardır. Pek çok üretici çeşitli seçenekler sunuyor, bazıları ise kendi yaklaşımlarının en ihtiyatlı yaklaşım olduğunu kanıtlamaya çalışıyor. Bu elbette saçmadır. Ancak çok az ürün birden fazla modda verimli bir şekilde çalışabilmektedir.
OLAP veri depolama seçenekleri
Bu bağlamda depolama, verilerin sürekli güncellenen durumda tutulması anlamına gelir.
Çok Boyutlu Veritabanları: Bu, verilerin bir sunucudaki çok boyutlu bir veritabanında saklandığını varsayar. Diğer sistemlerden ve ilişkisel veritabanlarından, son kullanıcı dosyalarından vb. çıkarılan ve özetlenen verileri içerebilir. Çoğu durumda, çok boyutlu veritabanları diskte depolanır, ancak bazı ürünler, en sık kullanılan verileri anında hesaplayarak RAM kullanmanıza izin verir. " Çok boyutlu veritabanlarına dayanan çok az ürün, verilerin birden fazla düzenlenmesine izin verir; çoğu ürün, tek bir düzenlemeye ancak birden fazla veri okunmasına izin verirken diğerleri yalnızca okumayla sınırlıdır.
Bu üç depolama konumu farklı depolama yeteneklerine sahiptir ve azalan kapasite sırasına göre düzenlenmiştir. Ayrıca farklı sorgu performans özelliklerine de sahiptirler: ilişkisel veritabanları son iki seçeneğe göre çok daha yavaştır.
OLAP verilerini işleme seçenekleri
Aynı veri işleme seçeneklerinden 3 tanesi vardır:
Sunucu tarafı çok boyutlu işleme: Burası istemci-sunucu OLAP uygulamalarında çok boyutlu hesaplamaların gerçekleştirildiği popüler bir yerdir ve birçok üründe kullanılır. Performans genellikle yüksektir çünkü hesaplamaların çoğu zaten yapılmıştır. Ancak bu çok fazla disk alanı gerektirir.
OLAP mimarilerinin matrisi
Buna göre depolama/işleme seçeneklerini birleştirerek OLAP sistem mimarilerinin bir matrisini elde etmek mümkündür. Buna göre teorik olarak bu yöntemlerin 9 kombinasyonu olabilir. Ancak bunlardan 3'ü sağduyudan yoksun olduğundan, gerçekte OLAP verilerini depolamak ve işlemek için yalnızca 6 seçenek vardır.
Çok boyutlu depolama seçenekleri Seçenekler |
İlişkisel veritabanı |
Sunucu tarafı çok boyutlu veritabanı |
İstemci bilgisayar |
Kartez Büyüklüğü |
|||
Çok boyutlu sunucu işleme |
Kristal Hololar (ROLAP modu) IBM DB2 OLAP Sunucusu CA EUREKA:Strateji Informix MetaCube Speedware Medyası/MR Microsoft Analiz Hizmetleri Oracle Express (ROLAP modu) Pilot Analiz Sunucusu Applix iTM1 |
Kristal Hololar Comshare Kararı Hyperion Essbase Oracle Ekspres Speedware Medyası/M Microsoft Analiz Hizmetleri PowerPlay Kurumsal Sunucu Pilot Analiz Sunucusu Applix iTM1 |
|
İstemci bilgisayarda çok boyutlu işleme |
Oracle Keşfi Informix MetaCube |
Boyutsal Bilgi Hyperion Kurumsal |
Cognos PowerPlay Kişisel Ekspres iTM1 Perspektifleri |
İşlemeyi belirleyen depolama olduğundan, depolama seçeneklerine göre gruplandırmak gelenekseldir; yani:
MOLAP ürünleri – sektör 4 ve 5'te
HOLAP ürünleri (hem çok boyutlu hem de ilişkisel veri depolama seçeneklerine izin verir) – 2 ve 4'te (italik)
40'tan fazla OLAP satıcısı var, ancak bunların hepsi rakip olarak kabul edilemiyor çünkü yetenekleri çok farklı ve aslında farklı pazar segmentlerinde faaliyet gösteriyorlar. Aralarındaki farklar aşağıdaki kavramlara dayanan 4 temel kategoriye ayrılabilirler: karmaşık işlevsellik - basit işlevsellik, performans - disk alanı. Kategorileri kare şeklinde göstermek, aralarındaki ilişkileri açıkça göstermesi açısından faydalıdır. Her kategorinin ayırt edici özelliği kendi tarafında temsil edilir ve diğerleriyle benzerlikler bitişik tarafta temsil edilir, bu nedenle karşı taraftaki kategoriler temelde farklıdır.
Özellikler |
Avantajları |
Kusurlar |
Temsilciler |
|
Uygulanan OLAP |
Zengin işlevlere sahip uygulamaları tamamlayın. Bazıları ilişkisel bir veritabanıyla çalışsa da, hemen hemen hepsi çok boyutlu bir veritabanı gerektirir. Satış, üretim, bankacılık, bütçeleme, finansal konsolidasyon, satış analizi gibi bu kategorideki uygulamaların çoğu uzmanlaşmıştır. |
Çeşitli uygulamalarla entegrasyon imkanı Yüksek düzeyde işlevsellik Yüksek düzeyde esneklik ve ölçeklenebilirlik |
Uygulama karmaşıklığı (kullanıcı eğitimi ihtiyacı) Yüksek fiyat |
Hyperion Çözümleri Kristal Kararları Bilgi Oluşturucular |
Ürün, verilerin çok boyutlu olarak depolanmasını, işlenmesini ve sunumunu sağlayan ilişkisel olmayan bir veri yapısına dayanmaktadır. Analiz sürecinde veriler çok boyutlu bir yapıdan özel olarak seçilir. Açıklığın yüksek düzeyine rağmen, tedarikçiler alıcıları kendi araçlarını satın almaya ikna ediyor |
Yüksek performans (özet göstergelerin hızlı hesaplanması ve herhangi bir boyut için çeşitli çok boyutlu dönüşümler). Çok boyutlu bir veri tabanı kullanıldığında geçici bir analitik sorguya verilen ortalama yanıt süresi genellikle RDB'ye göre 1-2 kat daha azdır. Yüksek düzeyde açıklık: entegrasyonun mümkün olduğu çok sayıda ürün Bilgi modeline çeşitli yerleşik işlevleri dahil etme, kullanıcı tarafından özel analizler yapma vb. görevlerle kolayca başa çıkabilirler. |
Verileri depolamak için geniş disk alanına ihtiyaç duyulması (depolanan verilerin fazlalığı nedeniyle). Bu, son derece verimsiz bir bellek kullanımıdır - denormalizasyon ve önceden yürütülen toplama nedeniyle, çok boyutlu bir veritabanındaki veri hacmi, orijinal ayrıntılı veri hacminden 2,5-100 kat daha azına karşılık gelir. Her durumda MOLAP aşağıdakilerle çalışmanıza izin vermez: büyük veritabanları veri. Gerçek sınır 10-25 gigabaytlık bir veritabanıdır Veritabanı "patlaması" potansiyeli, hacminde beklenmedik, keskin ve orantısız bir artıştır Veri yapılarını değiştirme konusunda esneklik eksikliği. Boyutların yapısındaki herhangi bir değişiklik neredeyse her zaman hiperküpün tamamen yeniden yapılandırılmasını gerektirir. Çok boyutlu veritabanları için şu anda arayüz için tek tip standartlar, verileri tanımlamaya ve işlemeye yönelik diller yoktur. |
Hyperion (Essbase) |
|
DOLAP (Masaüstü OLAP) |
Uygulanması oldukça kolay ve lisans başına maliyeti düşük olan istemci OLAP ürünleri Hiperküplerin küçük, boyutlarının küçük, ihtiyaçların mütevazı olduğu ve bu tür analitik işlemler için masaüstündeki kişisel bir makinenin yeterli olduğu bu tür analitik işlemlerden bahsediyoruz. Bu pazarın üreticilerinin hedefi yüzlerce ve binlerce işi otomatize etmektir ancak kullanıcıların oldukça basit bir analiz yapması gerekmektedir. Alıcılar genellikle gereğinden fazla iş satın almaya teşvik edilir |
Veritabanlarıyla iyi entegrasyon: çok boyutlu, ilişkisel Uygulama projelerinin maliyetini azaltan karmaşık satın alma imkanı Uygulamaların kullanım kolaylığı |
Çok sınırlı işlevsellik (bu bakımdan özel ürünlerle karşılaştırılamaz) Çok sınırlı güç (küçük veri hacimleri, az sayıda ölçüm) |
Cognos (PowerPlay) Iş nesneleri Kristal Kararları |
Bu pazarın en küçük sektörüdür. Ayrıntılı veriler başlangıçta olduğu yerde kalır; ilişkisel veritabanında; bazı kümeler aynı veritabanında özel olarak oluşturulmuş servis tablolarında saklanır |
Çok büyük miktarda veriyi işleyebilme (uygun maliyetli depolama) Yalnızca okuma değil, düzenleme modu da dahil olmak üzere çok kullanıcılı bir çalışma modu sağlayın Daha yüksek düzeyde veri koruması ve erişim haklarının farklılaştırılması için iyi seçenekler Ölçüm yapısında sık sık değişiklik yapılması mümkündür (veritabanının fiziksel olarak yeniden düzenlenmesini gerektirmez) |
Düşük performans, çok boyutlu olanlara tepki hızı açısından önemli ölçüde düşük (tepki karmaşık sorgular saniyeler yerine dakikalar hatta saatlerle ölçülür). Bunlar etkileşimli analiz araçlarından daha iyi rapor oluşturuculardır Ürünlerin karmaşıklığı. Bilgi teknolojisi uzmanlarından önemli bakım maliyetleri gerektirir. MOLAP ile karşılaştırılabilir performans sağlamak için ilişkisel sistemler, veritabanı şemasının dikkatli bir şekilde tasarlanmasını ve dizinlerin yapılandırılmasını gerektirir; bu, veritabanı yöneticilerinin çok fazla çaba harcamasını gerektirir. Uygulaması pahalı SQL'in sınırlamaları, verilerin çok boyutlu temsiline dayalı sistemlerde kolayca sağlanan birçok yerleşik işlevin RDBMS'de uygulanmasını engelleyen bir gerçek olmaya devam ediyor |
Bilgi Avantajı Informix (MetaCube) |
Microsoft Analysis Services, Oracle Express, Crystal Holos, IBM DB2 OLAPServer gibi ROLAP ve MOLAP modu seçimine izin veren hibrit ürünlerin tüketicilerinin neredeyse her zaman MOLAP modunu seçtiklerini belirtmek gerekir.
Sunulan kategorilerin her birinin kendi güçlü ve zayıf yönleri vardır, kimse yoktur optimal seçim. Seçim 3 önemli hususu etkiler: 1) performans; 2) veri depolama için disk alanı; 3) OLAP çözümünün yetenekleri, işlevselliği ve özellikle ölçeklenebilirliği. Bu durumda, işlenen veri hacmini, ekipmanın gücünü, kullanıcıların ihtiyaçlarını hesaba katmak ve hız ile veritabanının kapladığı disk alanının fazlalığı, basitlik ve çok yönlülük arasında bir uzlaşma aramak gerekir.
Hedef Veritabanının Hacmine Göre Veri Ambarlarının Sınıflandırılması
OLAP'ın dezavantajları
Her teknoloji gibi OLAP'ın da dezavantajları vardır: donanım, eğitim ve idari personel ve son kullanıcıların bilgisi için yüksek gereksinimler, uygulama projesinin uygulanması için yüksek maliyetler (hem parasal hem de zaman, entelektüel).
Doğru OLAP ürününü seçmek zordur ancak projenin başarısız olmasını istiyorsanız çok önemlidir.
Gördüğünüz gibi ürün farklılıkları birçok alanda yatıyor: işlevsel, mimari, teknik. Bazı ürünlerin ayarları çok sınırlıdır. Bazıları uzmanlaşmış konu alanları için yaratılmıştır: pazarlama, satış, finans. Uygulamaya özel bir kullanımı olmayan, oldukça esnek olması gereken genel amaçlı ürünler vardır. Kural olarak, bu tür ürünler özel ürünlerden daha ucuzdur, ancak uygulama maliyetleri daha yüksektir. OLAP ürün yelpazesi çok geniştir - ofis ürünlerinin parçası olan pivot tabloları ve grafikleri oluşturmaya yönelik en basit araçlardan, onbinlerce dolara mal olan verileri analiz etmeye ve kalıpları aramaya yönelik araçlara kadar.
Diğer alanlarda olduğu gibi OLAP alanında da araç seçimine ilişkin net yönergeler bulunamaz. Yalnızca birkaç önemli noktaya odaklanabilir ve önerilen yazılım yeteneklerini kuruluşun ihtiyaçlarıyla karşılaştırabilirsiniz. Önemli olan bir şey var: OLAP araçlarını nasıl kullanacağınızı düzgün bir şekilde düşünmeden, kendiniz için büyük bir baş ağrısı yaratma riskiyle karşı karşıya kalırsınız.
Seçim sürecinde dikkate alınması gereken 2 soru vardır:
Sonra tüm bunları karşılaştırın ve aslında bir seçim yapın.
Ne için kullanılacağını anlamadan rasyonel bir ürün seçimi yapamazsınız. Pek çok şirket, nasıl kullanılması gerektiği konusunda net bir anlayışa sahip olmadan "mümkün olan en iyi ürünü" istiyor.
Projenin başarılı bir şekilde uygulanabilmesi için, finans direktörünün en azından istek ve gereksinimlerini yöneticiye ve otomasyon hizmeti uzmanlarına yetkin bir şekilde formüle etmesi gerekir. OLAP seçimi konusunda yetersiz hazırlık ve farkındalıktan dolayı birçok sorun ortaya çıkmakta; BT uzmanları ve son kullanıcılar, konuşma sırasında farklı kavram ve terimleri manipüle ettikleri ve çelişkili tercihler öne sürdükleri için iletişim güçlükleri yaşamaktadırlar. Şirket içindeki hedeflerde tutarlılık olması gerekir.
OLAP ürün kategorilerine genel bakışı okuduktan sonra bazı faktörler zaten belirgin hale geldi:
Teknik yönler
Mevcut ve gelecekte görünecek girdi bilgilerinin miktarı
Kullanıcılar
Temel Özellikler: Veri Geri Yazma İhtiyaçları, Dağıtılmış Bilgi İşlem, Karmaşık Para Birimi Dönüşümleri, Rapor Yazdırma İhtiyaçları, Elektronik Tablo Arayüzü, Uygulama Mantığı Karmaşıklığı, Gerekli Boyutlar, Analiz Türleri: İstatistik, Hedef Arama, Durum Analizi
Uygulama
Analitik sistemlerin maliyetinin bugün bile oldukça yüksek olmasına ve bu tür sistemlerin uygulanmasına yönelik metodoloji ve teknolojilerin henüz başlangıç aşamasında olmasına rağmen, günümüzde sağladıkları ekonomik etki, geleneksel operasyonel sistemlerin etkisini önemli ölçüde aşmaktadır.
İş geliştirmenin uygun organizasyonunun, stratejik ve operasyonel planlamasının etkisini önceden ölçmek zordur, ancak bu tür sistemleri uygulama maliyetlerini onlarca, hatta yüzlerce kat aşabileceği açıktır. Ancak yanılmamak gerekir. Etki sistemin kendisi tarafından değil, onunla çalışan kişiler tarafından sağlanır. Bu nedenle “Veri Ambarı ve OLAP teknolojilerinden oluşan bir sistem, yöneticinin doğru kararları almasına yardımcı olacaktır” gibi beyanlar tamamen doğru değildir.” Modern analitik sistemler yapay zeka sistemleri değildir ve karar almaya ne yardımcı olabilirler ne de engel olabilirler. Amaçları, yöneticiye karar vermesi için gerekli tüm bilgileri uygun bir biçimde derhal sağlamaktır. Hangi bilgilerin isteneceği ve buna göre hangi kararın verileceği yalnızca onu kullanan kişiye bağlıdır.
Geriye söylenecek tek şey, bu sistemlerin birçok iş sorununu çözmeye yardımcı olabileceği ve geniş kapsamlı olumlu etkileri olabileceğidir. Bu yaklaşımın faydalarını ilk kimin fark edeceğini ve diğerlerinden önde olacağını henüz bilinmiyor.
OLAP(İngilizce Çevrimiçi Analitik İşleme'den - operasyonel analitik veri işleme, ayrıca: gerçek zamanlı analitik veri işleme, etkileşimli analitik veri işleme) - daha geniş bilgi alanının bir parçası olan çok boyutlu hiyerarşik temsillerine dayalı analitik veri işlemeye bir yaklaşım teknoloji - iş analistleri ().
OLAP çözümleri ve projelerinin kataloğu için TAdviser'daki OLAP bölümüne bakın.
Kullanıcının bakış açısından, OLAP Sistemler, çeşitli bölümlerdeki bilgilerin esnek bir şekilde görüntülenmesi, toplu verilerin otomatik olarak alınması, evrişim, detaylandırma ve zaman içinde karşılaştırma gibi analitik işlemlerin gerçekleştirilmesi için araçlar sağlar. Tüm bunlar, OLAP sistemlerini, verilerin çeşitli bölümlerde ve farklı hiyerarşi düzeylerinde (örneğin, satış raporları, çeşitli bütçe biçimleri vb.) sunumunu içeren, her türlü iş raporlaması için veri hazırlama alanında bariz avantajlara sahip bir çözüm haline getirir. Açık. Tahmin de dahil olmak üzere diğer veri analizi biçimlerinde böyle bir temsilin avantajları açıktır.
OLAP sistemleri için temel gereksinim, analistin bilgiyle etkileşimli çalışması sürecinde kullanılmasına olanak tanıyan hızdır. Bu anlamda, OLAP sistemleri ilk olarak geleneksel RDBMS ile karşılaştırılmaktadır; gruplama ve veri toplama kullanan analistler için tipik sorguların örnekleri genellikle bekleme süresi ve RDBMS'nin yüklenmesi açısından pahalıdır, bu nedenle onlarla herhangi bir etkileşimli çalışma için Önemli hacimlerdeki veriler karmaşıktır. İkincisi, OLAP sistemleri aynı zamanda verilerin olağan düz dosya sunumuna, örneğin sıklıkla kullanılan geleneksel elektronik tablolar biçimindeki, çok boyutlu verilerin karmaşık ve sezgisel olmayan sunumuna ve dilim noktalarını değiştirmeye yönelik işlemlere de karşıdır. veriler üzerinde görüş açısı - aynı zamanda zaman gerektirir ve verilerle etkileşimli çalışmayı karmaşıklaştırır.
Aynı zamanda, bir yandan OLAP sistemlerine özgü veri gereksinimleri, genellikle verilerin tipik OLAP görevleri için optimize edilmiş özel yapılarda depolanmasını gerektirirken, diğer yandan analiz sürecinde verilerin doğrudan mevcut sistemlerden çıkarılması ciddi bir düşüşe yol açacaktır; performanslarında.
Bu nedenle, ülkeler arasında en esnek ithalat-ihracat bağlantısının sağlanması önemli bir gerekliliktir. mevcut sistemler, veri kaynağı ve OLAP sistemi görevi görmenin yanı sıra OLAP sistemi ve dış veri analizi ve raporlama uygulamalarıdır.
Ayrıca böyle bir kombinasyon, çeşitli veri kaynaklarından ithalat-ihracatın desteklenmesi, verilerin temizlenmesi ve dönüştürülmesine yönelik prosedürlerin uygulanması, kullanılan sınıflandırıcıların ve referans kitaplarının birleştirilmesi gibi bariz gereklilikleri karşılamalıdır. Bu gereksinimlere ek olarak mevcut sistemlerde çeşitli veri güncelleme döngülerinin dikkate alınması ihtiyacı da eklenmiştir. bilgi sistemi ve gerekli düzeyde veri ayrıntısının birleştirilmesi. Bu sorunun karmaşıklığı ve çok yönlülüğü, veri ambarı kavramının ortaya çıkmasına ve dar anlamda ayrı bir veri dönüştürme ve dönüştürme yardımcı programları sınıfının - ETL'nin (Dönüştürme Yükünü Çıkarma) tanımlanmasına yol açtı.
Yukarıda OLAP'ın verilerin çok boyutlu hiyerarşik temsilini varsaydığını ve bir anlamda RDBMS tabanlı sistemlere karşı olduğunu belirtmiştik.
Ancak bu, tüm OLAP sistemlerinin aktif, "çalışan" sistem verilerini depolamak için çok boyutlu bir model kullandığı anlamına gelmez. Aktif veri depolama modeli, FASMI testinin gerektirdiği tüm gereksinimleri etkilediğinden, OLAP alt türlerinin geleneksel olarak çok boyutlu (MOLAP), ilişkisel (ROLAP) ve hibrit (HOLAP) olarak ayırt edilmesinin önemi bu temelde vurgulanmaktadır.
Ancak yukarıda belirtilenlerin öncülüğünde bazı uzmanlar Nigel beklemede, tek bir kritere dayalı sınıflandırmanın yeterince tamamlanmadığını gösterir. Üstelik mevcut OLAP sistemlerinin büyük çoğunluğu aşağıdakilerle ilgili olacaktır: hibrit tip. Bu nedenle, hangisinin geleneksel OLAP alt türlerinden hangisine karşılık geldiğini belirterek, aktif veri depolama modelleri üzerinde daha ayrıntılı olarak duracağız.
Bu durumda OLAP verileri, bu tür veriler için optimize edilmiş tasarımları kullanan çok boyutlu DBMS'lerde depolanır. Tipik olarak çok boyutlu DBMS'ler, gerekli hiyerarşi seviyeleri boyunca toplama dahil olmak üzere tüm tipik OLAP işlemlerini destekler.
Bu tür veri depolama bir anlamda OLAP için klasik olarak adlandırılabilir. Ancak bunun için ön veri hazırlamaya yönelik tüm adımlar tamamen gereklidir. Tipik olarak, çok boyutlu DBMS verileri diskte saklanır, ancak bazı durumlarda veri işlemeyi hızlandırmak için bu tür sistemler verilerin RAM'de saklanmasına izin verir. Aynı amaçlarla, bazen önceden hesaplanmış toplam değerlerin ve hesaplanan diğer değerlerin veritabanında saklanması kullanılır.
Rekabet halindeki okuma ve yazma işlemleriyle çok kullanıcılı erişimi tam olarak destekleyen çok boyutlu DBMS'ler oldukça nadirdir; bu tür DBMS'ler için genel mod, çok kullanıcılı okuma erişimiyle yazma erişimi olan tek kullanıcı veya çok kullanıcılı salt okunurdur.
Çok boyutlu DBMS'lerin ve bunlara dayalı OLAP sistemlerinin bazı uygulamalarının karakteristik eksiklikleri arasında, kullanıcı bakış açısından veritabanının kapladığı alan miktarında öngörülemeyen bir büyümeye karşı duyarlılıkları not edilebilir. Bu etki, toplu göstergelerin önceden hesaplanmış değerlerinin ve diğer miktarların veritabanında saklanmasını gerektiren, veritabanında depolanan bilgi hacminde doğrusal olmayan bir artışa neden olan sistemin reaksiyon süresini en aza indirme arzusundan kaynaklanmaktadır. yeni veri değerlerinin veya ölçümlerinin eklenmesi.
Bu sorunun ne ölçüde kendini gösterdiği ve seyrek veri küplerinin etkili bir şekilde depolanmasıyla ilgili sorunlar, OLAP sistemlerinin belirli uygulamaları için kullanılan yaklaşımların ve algoritmaların kalitesi tarafından belirlenir.
OLAP verileri aynı zamanda geleneksel bir RDBMS'de de saklanabilir. Çoğu durumda bu yaklaşım, OLAP'ı mevcut muhasebe sistemleriyle veya RDBMS tabanlı veri ambarlarıyla "acısız" bir şekilde entegre etmeye çalışırken kullanılır. Aynı zamanda bu yaklaşım, FASMI testinin gerekliliklerinin etkili bir şekilde yerine getirilmesini sağlamak (özellikle minimum sistem yanıt süresini sağlamak) için RDBMS'den bazı ek yetenekler gerektirir. Tipik olarak OLAP verileri normalleştirilmemiş biçimde saklanır ve önceden hesaplanmış bazı kümeler ve değerler özel tablolarda saklanır. Normalleştirilmiş bir biçimde saklandığında, aktif verileri depolamak için bir yöntem olarak RDBMS'nin etkinliği azalır.
Önceden hesaplanmış verileri depolamak için etkili yaklaşımlar ve algoritmalar seçme sorunu, RDBMS'ye dayalı OLAP sistemleri için de geçerlidir, dolayısıyla bu tür sistemlerin üreticileri genellikle kullanılan yaklaşımların yararlarına odaklanır.
Genel olarak, RDBMS'ye dayalı OLAP sistemlerinin, OLAP görevleri için daha az verimli olan veri depolama yapıları da dahil olmak üzere, çok boyutlu DBMS'lere dayalı sistemlerden daha yavaş olduğuna inanılmaktadır, ancak pratikte bu, belirli bir sistemin özelliklerine bağlıdır.
Verileri bir RDBMS'de saklamanın avantajları arasında bu tür sistemlerin daha fazla ölçeklenebilirliği yer alır.
Bu yaklaşım, veri yığınlarının normal dosyalarda saklanmasını içerir. Mevcut verileri istemci bilgisayarın diskinde veya RAM'inde önbelleğe alarak işi hızlandırmak için genellikle iki ana yaklaşımdan birine ek olarak kullanılır.
Genellikle OLAP sisteminin kendisine ek olarak DBMS, ETL (Dönüştürme Yükünü Çıkarma) ve raporlama araçları da dahil olmak üzere kapsamlı çözümlerini destekleyen çoğu OLAP sistemi üreticisi, şu anda aktif sistem verilerinin depolanmasını organize etmek ve dağıtmak için hibrit bir yaklaşım kullanıyor. RDBMS ile özel depolama arasında ve ayrıca disk yapıları ile bellek içi önbelleğe alma arasında şu veya bu şekilde.
Böyle bir çözümün etkinliği, imalatçının belirli yaklaşımlara ve algoritmalara bağlı olup olmadığını belirlemek için kullanılır. hangi veriler ve nerede saklanacak, daha sonra, söz konusu sistemin belirli özelliklerini değerlendirmeden, bir sınıf olarak bu tür çözümlerin başlangıçta daha yüksek verimliliği hakkında aceleyle sonuçlar çıkarın.
OLAP(eng. çevrimiçi analitik işleme) – analitik veritabanlarında çok boyutlu sorguların dinamik olarak işlenmesi için bir dizi yöntem. Bu tür veri kaynakları genellikle oldukça büyüktür ve bunları işlemek için kullanılan araçlardaki en önemli gereksinimlerden biri yüksek hız. İlişkisel veritabanlarında bilgiler iyi normalize edilmiş ayrı tablolarda saklanır. Ancak karmaşık çok tablolu sorgular bunlarda oldukça yavaş yürütülür. Fazla en iyi performans OLAP sistemlerinde işlem hızı, veri depolama yapısının özellikleri nedeniyle elde edilir. Tüm bilgiler açıkça düzenlenmiştir ve iki tür veri depolama alanı kullanılmaktadır: ölçümler(satış noktaları, müşteriler, çalışanlar, hizmetler vb. gibi kategorilere ayrılmış dizinler içerir) ve veri(elementlerin etkileşimini karakterize edin) çeşitli ölçümlerörneğin, 3 Mart 2010'da A satıcısı, C mağazasında B müşterisine D para birimi tutarında bir hizmet sunmuştur. Analiz Küpünde sonuçları hesaplamak için ölçümler kullanılır. Ölçüler, karşılık gelen seçilen boyutlar ve bunların unsurları tarafından bir araya getirilen gerçeklerin toplamıdır. Bu özellikler sayesinde çok boyutlu verilerle yapılan karmaşık sorgulamalar, ilişkisel kaynaklara göre çok daha az zaman alır.
OLAP sistemlerinin ana satıcılarından biri Microsoft Corporation'dır. Microsoft SQL Server Business Intelligence Development Studio (BIDS) ve Microsoft Office PerformancePoint Sunucu Planlama İş Modelleyicisi (PPS) uygulamalarında analitik küp oluşturmanın pratik örneklerini kullanarak OLAP ilkelerinin uygulanmasına bakalım ve çok boyutlu görsel temsil olanaklarını tanıyalım Veriler grafikler, çizelgeler ve tablolar şeklindedir.
Örneğin, TEKLİFLER'de bir sigorta şirketi, çalışanları, ortakları (müşterileri) ve satış noktaları hakkındaki verileri kullanarak bir OLAP küpü oluşturmak gerekir. Şirketin tek tür hizmet sağladığını varsayalım, dolayısıyla hizmetlerin ölçümüne gerek kalmayacaktır.
Öncelikle ölçüleri tanımlayalım. Aşağıdaki varlıklar (veri kategorileri) şirketin faaliyetleriyle ilişkilidir:
Gördüğünüz gibi olgu tablosu, tanımlayıcı alanların (PartnerID, EmployeeID vb.) birebir yazışması yoluyla boyut tablolarına bağlanmaktadır.
Sonuca bakalım. Küp gezgini sekmesinde, ölçüleri ve boyutları toplamlar, satırlar, sütunlar ve filtre alanlarına sürükleyerek ilgilendiğimiz verilerin bir görünümünü elde edebiliriz (örneğin, belirli bir çalışan tarafından 2005 yılında imzalanan sigorta sözleşmeleriyle ilgili yapılan işlemler).