Moniulotteinen tiedon esitys. Yleinen kaavio tietovaraston järjestämisestä. OLAP- ja OLTP-tekniikoiden ominaisuudet, tyypit ja tärkeimmät erot. Tähti- ja lumihiutalekuvioita. Aggregointi. OLAP-järjestelmät Moniulotteiset tiedot ja olap-tekniikat

Äskettäin julkaistussa artikkelisarjassa "Johdatus tietokantoihin" (katso ComputerPress nro 3'2000 - 3'2001) keskustelimme erilaisista tietojärjestelmien luomisessa käytettävistä teknologioista ja ohjelmistoista - työpöytä- ja palvelintietokantajärjestelmät, tiedon suunnittelutyökalut, sovelluskehitys työkalut sekä Business Intelligence - yritystason tiedon analysointi- ja käsittelytyökalut, joista on tällä hetkellä tulossa yhä suositumpia maailmassa, myös maassamme. Toteamme kuitenkin, että Business Intelligence -työkalujen käyttökysymyksiä ja tämän luokan sovellusten luomiseen käytettyjä teknologioita ei ole vielä käsitelty riittävästi kotimaisessa kirjallisuudessa. Uudessa artikkelisarjassa yritämme täyttää tämän aukon ja puhua tällaisten sovellusten taustalla olevista teknologioista. Toteutusesimerkkeinä käytämme pääasiassa Microsoftin OLAP-tekniikoita (lähinnä Microsoftin analyysipalveluita SQL Server 2000), mutta toivomme, että suurin osa materiaalista on hyödyllistä muiden työkalujen käyttäjille.

Tämän sarjan ensimmäinen artikkeli on omistettu OLAP:n (On-Line Analytical Processing) - teknologian moniulotteiseen data-analyysiin - perusteisiin. Siinä tarkastellaan tietovarastoinnin ja OLAPin käsitteitä, tietovarastoinnin ja OLAP-työkalujen vaatimuksia, OLAP-tiedon loogista järjestystä sekä moniulotteisen analyysin peruskäsitteitä ja käsitteitä.

Mikä on tietovarasto

Yritystason tietojärjestelmät sisältävät pääsääntöisesti sovelluksia, jotka on suunniteltu datan, sen dynamiikan, trendien jne. monimutkaiseen moniulotteiseen analysointiin. Sellaisen analyysin tarkoituksena on viime kädessä tukea päätöksentekoa. Näitä järjestelmiä kutsutaan usein päätöksen tukijärjestelmiksi.

On mahdotonta tehdä johtamispäätöstä ilman tarvittavaa tietoa, yleensä määrällistä. Tämä vaatii luomista tietovarastot(Tietovarastot), toisin sanoen tietojen keräämis-, seulonta- ja esikäsittelyprosessi, jotta tuloksena olevat tiedot toimitetaan käyttäjille tilastoanalyysiä varten (ja usein analyyttisten raporttien luomiseksi).

Ralph Kimball, yksi tietovarastokonseptin luojista, kuvaili tietovarastoa "paikaksi, jossa ihmiset voivat käyttää tietojaan" (katso esimerkiksi Ralph Kimball, "The Data Warehouse Toolkit: Practical Techniques for Building Dimensions Data Warehouses" ", John Wiley & Sons, 1996 ja "The Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse", John Wiley & Sons, 2000). Hän muotoili myös tietovarastojen perusvaatimukset:

  • nopea tuki vastaanottaa tietoja varastosta;
  • sisäisten tietojen johdonmukaisuuden säilyttäminen;
  • kyky hankkia ja verrata niin sanottuja dataviipaleita (slice and dice);
  • kätevien apuohjelmien saatavuus tietojen tarkastelemiseen tallennustilassa;
  • tallennettujen tietojen täydellisyys ja luotettavuus;
  • korkealaatuisen tietojen täydennysprosessin tuki.

Usein ei ole mahdollista täyttää kaikkia edellä mainittuja vaatimuksia saman tuotteen sisällä. Siksi tietovarastojen toteuttamiseen käytetään yleensä useita tuotteita, joista osa on varsinaisia ​​tiedontallennustyökaluja, toiset työkaluja niiden hakemiseen ja katseluun, toiset työkaluja niiden täydentämiseen jne.

Tyypillinen tietovarasto on tyypillisesti erilainen kuin tyypillinen relaatiotietokanta. Ensinnäkin tavalliset tietokannat on suunniteltu auttamaan käyttäjiä päivittäisessä työssä, kun taas tietovarastot on suunniteltu päätöksentekoa varten. Esimerkiksi tavaroiden myynti ja laskujen laatiminen tapahtuu tapahtumien käsittelyyn tarkoitetun tietokannan avulla ja usean vuoden myynnin dynamiikan analyysi, joka mahdollistaa suunnittelutyön tavarantoimittajien kanssa, tehdään tietovaraston avulla.

Toiseksi tavanomaisia ​​tietokantoja sovelletaan jatkuvat muutokset käyttäjien työskennellessä ja tietovarasto on suhteellisen vakaa: siinä olevat tiedot päivittyvät yleensä aikataulun mukaan (esim. viikoittain, päivittäin tai tunneittain - tarpeiden mukaan). Ihannetapauksessa rikastusprosessi on yksinkertaisesti uuden tiedon lisääminen tietyn ajanjakson aikana muuttamatta aiempia tietoja, jotka ovat jo varastossa.

Ja kolmanneksi, tavalliset tietokannat ovat useimmiten varastoon päätyvien tietojen lähde. Lisäksi arkistoa voidaan täydentää ulkoisista lähteistä, kuten tilastoraporteista.

Mikä on OLAP

Päätöksentukijärjestelmillä on yleensä välineet tarjota käyttäjälle aggregoituja tietoja eri näytteistä alkuperäisestä sarjasta sellaisessa muodossa, joka on kätevä havaita ja analysoida. Tyypillisesti tällaiset aggregaattifunktiot muodostavat moniulotteisen (ja siksi ei-relatiivisen) tietojoukon (kutsutaan usein hyperkuutioksi tai metakuutioksi), jonka akselit sisältävät parametreja ja joiden solut sisältävät niistä riippuvaa aggregaattidataa. Kunkin akselin varrella tiedot voidaan järjestää hierarkiaan, joka edustaa eri yksityiskohtaisia ​​tasoja. Tämän tietomallin ansiosta käyttäjät voivat muotoilla monimutkaiset kyselyt, luoda raportteja, hankkia data-alajoukkoja.

Teknologiaa moniulotteiseen data-analyysiin kutsutaan OLAP:ksi (On-Line Analytical Processing). OLAP on tärkeä osa tietovarastointia. OLAP-käsitteen kuvasi vuonna 1993 Edgar Codd, tunnettu tietokantatutkija ja relaatiotietomallin kirjoittaja (katso E.F. Codd, S.B. Codd ja C.T. Salley, Providing OLAP (on-line analytical processing)) käyttäjäanalyytikoille: An. IT-mandaatti Tekninen raportti, 1993). Vuonna 1995 Coddin asettamien vaatimusten perusteella muotoiltiin niin kutsuttu FASMI-testi (Fast Analysis of Shared Multidimensional Information), joka sisältää seuraavat vaatimukset moniulotteisen analyysin sovelluksille:

  • antaa käyttäjälle analyysitulokset hyväksyttävä aika(yleensä enintään 5 s), jopa vähemmän yksityiskohtaisen analyysin kustannuksella;
  • kyky suorittaa mikä tahansa looginen ja tilastollinen analyysi, joka on ominaista Tämä hakemus, ja tallentamalla sen loppukäyttäjän saatavilla olevassa muodossa;
  • usean käyttäjän pääsy tietoihin asianmukaisten lukitusmekanismien ja valtuutetun pääsyn avulla;
  • tietojen moniulotteinen käsitteellinen esitys, mukaan lukien hierarkioiden ja useiden hierarkioiden täysi tuki (tämä on OLAPin keskeinen vaatimus);
  • mahdollisuus päästä käsiksi kaikkiin tarvittaviin tietoihin niiden määrästä ja tallennuspaikasta riippumatta.

On huomioitava, että OLAP-toiminnallisuutta voidaan toteuttaa monin eri tavoin toimistosovellusten yksinkertaisimmista data-analyysityökaluista palvelintuotteisiin perustuviin hajautettuihin analyyttisiin järjestelmiin. Mutta ennen kuin puhumme tämän toiminnon erilaisista toteutuksista, katsotaanpa, mitä ne ovat. OLAP kuutiot loogisesta näkökulmasta.

Moniulotteiset kuutiot

Tässä osiossa tarkastellaan lähemmin OLAP:n ja moniulotteisten kuutioiden käsitettä. Esimerkkinä relaatiotietokannasta, jota käytämme havainnollistamaan OLAPin periaatteita, käytämme jakelusarjoihin sisältyvää Northwind-tietokantaa. Microsoft SQL Palvelin tai Microsoft Access ja on tyypillinen tietokanta, joka tallentaa tietoa elintarvikkeiden tukkukauppaa harjoittavan yrityksen kaupankäynnistä. Tällaisia ​​tietoja ovat tiedot toimittajista, asiakkaista, toimitusyrityksistä, luettelo toimitetuista tavaroista ja niiden luokista, tiedot tilauksista ja tilatuista tuotteista, luettelo yrityksen työntekijöistä. Yksityiskohtainen kuvaus Northwind-tietokannat löytyvät Microsoft SQL Serverin tai Microsoft Accessin ohjejärjestelmistä - emme luettele niitä tässä tilanpuutteen vuoksi.

OLAP-konseptin tutkimiseksi käytämme Northwind-tietokannan Laskut-näkymää ja Products and Categories -taulukoita kyselyn luomiseen, joka johtaa yksityiskohtaisiin tietoihin kaikista tilatuista tuotteista ja laskuista:

SELECT dbo.Invoices.Country, dbo.Invoices.city, dbo.Invoices.CustomerName, dbo.Invoices.Salesperson, dbo.Invoices.OrderDate, dbo.Categories.CategoryName, dbo.Invoices.ProductName, dbo.Invoices, dbo.Invoices .Invoices.ExtendedPrice FROM dbo.Products SISÄINEN LIITTYMINEN dbo.Categories ON dbo.Products.CategoryID = dbo.Categories.CategoryID SISÄINEN JOIN dbo.Invoices ON dbo.Products.ProductID = dbo.Invoices.

Access 2000:ssa samanlainen kysely näyttää tältä:

SELECT Invoices.Country, Invoices.City, Invoices.Customers.CompanyName AS CustomerName, Invoices.Salesperson, Invoices.OrderDate, Categories.CategoryName, Invoices.ProductName, Invoices.Shippers.CompanyName, FJONS. (Laskut INNER JOIN Products ON Invoices.ProductID = Products.ProductID) ON Categories.CategoryID = Products.CategoryID;

Tämä kysely avaa Laskut-näkymän, joka sisältää tiedot kaikista lähetetyistä laskuista, sekä Luokat- ja Tuotteet-taulukoita, jotka sisältävät tietoja tilatuista tuoteluokista ja itse tuotteista. Tämän pyynnön tuloksena on joukko tilaustietoja, jotka sisältävät tilatun tuotteen luokan ja nimen, tilauksen päivämäärän, laskuttajan nimen, tilaavan yrityksen kaupungin, maan ja yrityksen nimen sekä varustamon nimenä.

Tallennetaan tämä pyyntö mukavuuden vuoksi näkymänä, nimeltään Invoices1. Tämän esityksen käyttämisen tulos on esitetty kuvassa. 1 .

Mitä aggregoituja tietoja voimme saada tästä näkymästä? Yleensä nämä ovat vastauksia kysymyksiin, kuten:

  • Mikä on ranskalaisten asiakkaiden tekemien tilausten kokonaisarvo?
  • Mikä on asiakkaiden Ranskassa tekemien ja Speedy Expressin toimittamien tilausten kokonaisarvo?
  • Mikä on asiakkaiden Ranskassa vuonna 1997 tekemien ja Speedy Expressin toimittamien tilausten kokonaisarvo?

Käännetään nämä kysymykset SQL:n kyselyiksi (taulukko 1).

Minkä tahansa yllä olevan kyselyn tulos on luku. Jos korvaat ensimmäisessä kyselyssä parametrin "Ranska" arvolla "Itävalta" tai toisen maan nimellä, voit suorittaa tämän kyselyn uudelleen ja saada toisen numeron. Suorittamalla tämä toimenpide kaikkien maiden kanssa, saamme seuraavan tietojoukon (katso näkyy alla):

Maa SUM (ExtendedPrice)
Argentiina 7327.3
Itävalta 110788.4
Belgia 28491.65
Brasilia 97407.74
Kanada 46190.1
Tanska 28392.32
Suomi 15296.35
Ranska 69185.48
Saksa 209373.6

Tuloksena oleva aggregaattiarvojen joukko (tässä tapauksessa summat) voidaan tulkita yksiulotteiseksi tietojoukoksi. Sama tietojoukko voidaan saada myös seuraavan muotoisen GROUP BY -lauseen kyselyn tuloksena:

VALITSE maa, SUMMA (ExtendedPrice) FROM invoices1 GROUP BY Country

Katsotaan nyt toista yllä olevaa kyselyä, joka sisältää kaksi ehtoa WHERE-lauseessa. Jos suoritamme tämän kyselyn ja liitämme kaikki mahdolliset arvot Country- ja ShipperName-parametreille, saamme kaksiulotteisen tietojoukon, joka näyttää tältä (katkelma näkyy alla):

LähettäjäNimi
Maa Liittovaltion merenkulku Speedy Express Yhdistynyt paketti
Argentiina 1 210.30 1 816.20 5 092.60
Itävalta 40 870.77 41 004.13 46 128.93
Belgia 11 393.30 4 717.56 17 713.99
Brasilia 16 514.56 35 398.14 55 013.08
Kanada 19 598.78 5 440.42 25 157.08
Tanska 18 295.30 6 573.97 7 791.74
Suomi 4 889.84 5 966.21 7 954.00
Ranska 28 737.23 21 140.18 31 480.90
Saksa 53 474.88 94 847.12 81 962.58

Tällaista tietojoukkoa kutsutaan pivot-taulukoksi tai ristitaulukoksi. Monet laskentataulukot ja työpöydän DBMS:t antavat sinun luoda tällaisia ​​taulukoita - Paradox for DOS:sta Microsoft Excel 2000. Esimerkiksi tältä samanlainen kysely näyttää Microsoft Access 2000:ssa:

MUUNTAA Summa(Laskut1.Laajennettu hinta) AS SumOfExtendedPrice SELECT Laskut1.Maa FROM Invoices1 GROUP BY Invoices1.Country PIVOT Invoices1.ShipperName;

Tällaisen pivot-taulukon koostetiedot voidaan saada myös käyttämällä tavallista GROUP BY -kyselyä:

SELECT Country,ShipperName, SUM (ExtendedPrice) FROM invoices1 GROUP BY COUNTRY,ShipperName Huomaa kuitenkin, että tämän kyselyn tulos ei ole itse pivot-taulukko, vaan vain joukko sen muodostamiseen tarvittavia koostetietoja (katkelma näkyy alla ):

Maa LähettäjäNimi SUM (ExtendedPrice)
Argentiina Liittovaltion merenkulku 845.5
Itävalta Liittovaltion merenkulku 35696.78
Belgia Liittovaltion merenkulku 8747.3
Brasilia Liittovaltion merenkulku 13998.26

Kolmannella edellä käsitellyistä kyselyistä on jo kolme parametria WHERE-ehdossa. Vaihtelemalla niitä saadaan kolmiulotteinen tietojoukko (kuva 2).

Kuvassa esitetyn kuution solut. 2 sisältävät aggregoituja tietoja, jotka vastaavat kuution akseleilla sijaitsevan WHERE-lauseen kyselyparametrien arvoja.

Voit saada joukon kaksiulotteisia taulukoita leikkaamalla kuution, jonka tasot ovat samansuuntaiset sen pintojen kanssa (niitä käytetään termeillä poikkileikkaukset ja viipaleet).

Ilmeisesti kuutiosolujen sisältämä data voidaan saada myös sopivalla GROUP BY -lauseella varustetulla kyselyllä. Lisäksi joissakin laskentataulukoissa (erityisesti Microsoft Excel 2000:ssa) voit myös piirtää kolmiulotteisen tietojoukon ja tarkastella kuution eri poikkileikkauksia sen pinnan suuntaisesti, kuten työkirjaarkissa näkyy.

Jos WHERE-lause sisältää neljä tai useampia parametreja, tuloksena oleva arvojoukko (jota kutsutaan myös OLAP-kuutioksi) voi olla 4-ulotteinen, 5-ulotteinen jne.

Tarkasteltuamme, mitä moniulotteiset OLAP-kuutiot ovat, siirrytään muutamiin moniulotteisen data-analyysin keskeisiin termeihin ja käsitteisiin.

Jotkut termit ja käsitteet

Summien lisäksi OLAP-kuution solut voivat sisältää muiden aggregaattitoimintojen suorittamisen tuloksia SQL-kieli, kuten MIN, MAX, AVG, COUNT, ja joissakin tapauksissa muita (varianssi, keskihajonna jne.). Solujen tietoarvojen kuvaamiseen käytetään termiä yhteenveto (yleensä niitä voi olla useita yhdessä kuutiossa), termillä mitta tarkoitetaan lähdetietoa, jonka perusteella ne lasketaan, ja termiä dimension käytetään merkitsemään kyselyparametreja (venäjäksi käännettynä kutsutaan yleensä "dimension" kun puhutaan OLAP-kuutioista ja "dimension" kun puhutaan tietovarastoista). Akseleille piirrettyjä arvoja kutsutaan mittajäseniksi.

Mittauksista puhuttaessa on syytä mainita, että akseleille piirretyt arvot voivat olla eritasoisia. Saatamme esimerkiksi olla kiinnostuneita eri maiden asiakkaiden tekemien tilausten kokonaisarvosta tai ulkomailla olevien asiakkaiden tai jopa yksittäisten asiakkaiden tilausten kokonaisarvosta. Luonnollisesti tuloksena saatu aggregaattidata toisessa ja kolmannessa tapauksessa on yksityiskohtaisempi kuin ensimmäisessä. Huomaa, että kyky hankkia koostetietoja vaihtelevalla tarkkuudella täyttää yhden tietovarastojen vaatimuksista - vaatimuksen erilaisten tietoviipaleiden saatavuudesta vertailua ja analysointia varten.

Koska tarkasteltavassa esimerkissä jokaisessa maassa voi yleensä olla useita kaupunkeja ja kaupungilla voi olla useita asiakkaita, voimme puhua arvojen hierarkioista ulottuvuuksissa. Tässä tapauksessa maat sijaitsevat hierarkian ensimmäisellä tasolla, kaupungit ovat toisella ja asiakkaat ovat kolmannella (kuva 3).

Huomaa, että hierarkiat voivat olla tasapainossa, kuten kuvassa 1 esitetty hierarkia. 3, sekä hierarkiat, jotka perustuvat päivämäärä-aikaan ja epätasapainoiseen dataan. Tyypillinen esimerkki epätasapainoisesta hierarkiasta on "ylempi-alisteinen" hierarkia (se voidaan rakentaa esimerkiksi käyttämällä yllä mainitun esimerkin alkuperäisen tietojoukon Myyjä-kentän arvoja), joka näkyy kuvassa 1. 4.

Joskus tällaisista hierarkioista käytetään termiä vanhempi-lapsi-hierarkia.

On myös hierarkioita, jotka ovat tasapainoisen ja epätasapainoisen välillä (niitä kutsutaan termillä repaleinen). Ne sisältävät tyypillisesti jäseniä, joiden loogiset "vanhemmat" eivät ole välittömästi ylimmällä tasolla (esimerkiksi maantieteellisellä hierarkialla on tasot Maa, kaupunki ja osavaltio, mutta tietojoukossa on maita, joilla ei ole osavaltioita tai alueita maan ja maan välillä. kaupunkitasot ; kuva 5).

Huomaa, että kaikki OLAP-työkalut eivät tue epätasapainoisia ja "epätasaisia" hierarkioita. Esimerkiksi Microsoft Analysis Services 2000 tukee molempia hierarkiatyyppejä, mutta Microsoft OLAP Services 7.0 tukee vain tasapainotettuja hierarkiatyyppejä. Hierarkiatasojen määrä voi vaihdella eri OLAP-työkaluissa ja enimmäismäärä voimassa oleva numero saman tason jäseniä ja itse enimmäismäärää mittoja.

Johtopäätös

Tässä artikkelissa opimme OLAPin perusteet. Opimme seuraavaa:

  • Tietovarastojen tarkoitus on tarjota käyttäjille tietoa tilastollista analyysia ja johtamispäätösten tekemistä varten.
  • Tietovarastojen on tarjottava suuri nopeus tiedon saaminen, kyky hankkia ja verrata ns. dataviipaleita sekä tietojen johdonmukaisuus, täydellisyys ja luotettavuus.
  • OLAP (On-Line Analytical Processing) on ​​tärkeä osa tietovarastojen rakentamista ja käyttöä. Tämä tekniikka perustuu moniulotteisten tietojoukkojen - OLAP-kuutioiden - rakentamiseen, joiden akselit sisältävät parametreja ja solut sisältävät niistä riippuvaa aggregoitua dataa.
  • OLAP-toiminnallisilla sovelluksilla on annettava käyttäjälle analyysitulokset hyväksyttävässä ajassa, suoritettava looginen ja tilastollinen analyysi, tuettava usean käyttäjän pääsyä tietoihin, tarjottava moniulotteinen käsitteellinen esitys tiedoista ja voitava käyttää kaikkia tarvittavia tietoja.

Lisäksi käytiin läpi OLAP-kuutioiden loogisen organisoinnin perusperiaatteet ja opittiin myös moniulotteisen analyysin perustermit ja käsitteet. Ja lopuksi saimme selville, mitä ne ovat Erilaisia ​​tyyppejä hierarkiat OLAP-kuutiodimensioissa.

Tämän sarjan seuraavassa artikkelissa tarkastelemme tietovarastojen tyypillistä rakennetta, puhumme siitä, mitä asiakas- ja palvelin OLAP on, ja keskitymme myös joihinkin moniulotteisen tiedon tallennuksen teknisiin näkökohtiin.

ComputerPress 4"2001

tietovarastot muodostetaan pitkän ajanjakson aikana tallennettujen toiminnallisten tietokantojen tilannekuvien perusteella tietojärjestelmä ja mahdollisesti useat ulkoiset lähteet. Tietovarastot käyttävät tietokantatekniikoita, OLAP:ia, syvää data-analyysiä ja tietojen visualisointia.

Tietovarastojen tärkeimmät ominaisuudet.

  • sisältää historiallisia tietoja;
  • tallentaa yksityiskohtaiset tiedot sekä osittain ja kokonaan yhteenvetotiedot;
  • tiedot ovat enimmäkseen staattisia;
  • tilapäinen, jäsentämätön ja heuristinen tapa käsitellä tietoja;
  • keski- ja alhainen tapahtumakäsittelyn intensiteetti;
  • arvaamaton tapa käyttää tietoja;
  • tarkoitettu analyysiin;
  • keskittynyt aihealueita;
  • strategisen päätöksenteon tukeminen;
  • palvelee suhteellisen pientä määrää johtohenkilöitä.

Termiä OLAP (On-Line Analytical Processing) käytetään kuvaamaan tiedon esittämismallia ja vastaavasti teknologiaa sen käsittelemiseksi tietovarastoissa. OLAP käyttää moniulotteista näkymää kootuista tiedoista tarjotakseen nopean pääsyn strategisiin tietoihin tärkeää tietoa perusteellista analyysiä varten. OLAP-sovelluksilla on oltava seuraavat perusominaisuudet:

  • moniulotteinen tietojen esittäminen;
  • tuki monimutkaisille laskelmille;
  • aikatekijän oikea huomioiminen.

OLAPin edut:

  • edistäminen tuottavuutta tuotantohenkilöstö, kehittäjät sovellusohjelmia. Oikea-aikainen pääsy strategiseen tietoon.
  • tarjoaa käyttäjille riittävän mahdollisuuden tehdä omia muutoksia skeemaan.
  • OLAP-sovellukset luottavat tietovarastot ja OLTP-järjestelmät, jotka vastaanottavat niistä nykyiset tiedot, mikä mahdollistaa tallennuksen eheyden valvonta yritystiedot.
  • vähentää OLTP-järjestelmien kuormitusta ja tietovarastot.

OLAP ja OLTP. Ominaisuudet ja tärkeimmät erot

OLAP OLTP
Tietovarasto tulee sisältää sekä yrityksen sisäiset tiedot että ulkoiset tiedot Pääasiallinen operatiiviseen tietokantaan tuleva tietolähde on yhtiön toiminta ja tietojen analysointi vaatii ulkopuolisten tietolähteiden (esim. tilastoraportit) osallistumista
Analyyttisten tietokantojen määrä on vähintään suuruusluokkaa suurempi kuin operatiivisten tietokantojen määrä. tehdä luotettavia analyyseja ja ennusteita tietovarasto sinulla on oltava tietoa yhtiön toiminnasta ja markkinatilanteesta usean vuoden ajalta Nopeaa käsittelyä varten tarvitaan viimeisten kuukausien tiedot
Tietovarasto tulee sisältää yhtenäisesti esitettyä ja johdonmukaista tietoa, joka on mahdollisimman lähellä operatiivisten tietokantojen sisältöä. Tarvitaan komponentti tiedon poimimiseen ja "puhdistamiseen" eri lähteistä. Monissa suurissa yrityksissä on samanaikaisesti olemassa useita operatiivisia tietojärjestelmiä, joissa on omat tietokannat (historiallisista syistä). Toiminnalliset tietokannat voivat sisältää semanttisesti vastaavaa tietoa eri muodoissa, eri merkinnöin sen vastaanottoajasta, joskus jopa ristiriitaisia.
Analyyttisen tietokannan kyselyiden joukkoa ei voida ennustaa. tietovarastot olemassa vastaamaan analyytikoiden ad hoc -pyyntöihin. Voit vain luottaa siihen, että pyyntöjä ei tule liian usein ja ne sisältävät suuria määriä tietoa. Analyyttisen tietokannan koko kannustaa käyttämään aggregaatteja (summa, minimi, maksimi, keskiarvo jne.) Tietojenkäsittelyjärjestelmät on luotu ratkaisemaan tiettyjä ongelmia. Tietokannasta valitaan tietoja usein ja pienissä erissä. Tyypillisesti joukko kyselyitä operatiiviseen tietokantaan tunnetaan jo suunnittelun aikana
Kun analyyttisten tietokantojen vaihtelevuus on vähäistä (vain dataa ladattaessa), taulukoiden järjestäminen, nopeammat indeksointimenetelmät massanäytteenottoa varten ja esikoottujen tietojen tallennus osoittautuvat kohtuullisiksi. Tietojenkäsittelyjärjestelmät ovat luonteeltaan erittäin vaihtelevia, mikä huomioidaan käytetyssä DBMS-järjestelmässä (normalisoitu tietokantarakenne, epäjärjestyksessä tallennetut rivit, B-puut indeksointiin, kaupallinen)
Analyyttiset tietokantatiedot ovat niin tärkeitä yritykselle, että tarvitaan suurempaa suojausta (yksittäiset käyttöoikeudet tietyille taulukon riveille ja/tai sarakkeille) Tietojenkäsittelyjärjestelmille se yleensä riittää tietojen suojaaminen pöydän tasolla

Coddin säännöt OLAP-järjestelmille

Vuonna 1993 Codd julkaisi OLAP for User Analysts: What It Should Be. Siinä hän hahmotteli online-analytiikan peruskäsitteet ja määritteli 12 sääntöä, jotka online-analytiikkaominaisuuksia tarjoavien tuotteiden on täytettävä.

  1. Käsitteellinen moniulotteinen esitys. OLAP-mallin ytimessä on oltava moniulotteinen. Moniulotteinen käsitteellinen kaavio tai mukautettu esitys helpottaa mallintamista ja analysointia sekä laskelmia.
  2. Läpinäkyvyys. Käyttäjä voi saada kaikki tarvittavat tiedot OLAP-moottorista tietämättä edes mistä ne tulevat. Riippumatta siitä, onko OLAP-tuote osa käyttäjän työkaluja vai ei, tämän tosiasian tulisi olla käyttäjälle näkymätön. Jos OLAP saadaan asiakas-palvelin-laskennan avulla, tämän tosiasian tulisi myös mahdollisuuksien mukaan olla käyttäjälle näkymätön. OLAP on tarjottava aidosti avoimen arkkitehtuurin yhteydessä, jolloin käyttäjä voi kommunikoida palvelimen kanssa analyyttisen työkalun avulla missä tahansa. Tämän lisäksi läpinäkyvyyttä tulisi saavuttaa myös silloin, kun analyyttinen työkalu on vuorovaikutuksessa homogeenisten ja heterogeenisten tietokantaympäristöjen kanssa.
  3. Saatavuus. OLAPin on toimitettava omansa logiikka piiri päästä käsiksi heterogeeniseen tietokantaympäristöön ja suorittaa asianmukaiset muunnokset tietojen toimittamiseksi käyttäjälle. Lisäksi on huolehdittava etukäteen siitä, missä ja miten ja minkä tyyppistä fyysistä järjestystä dataa todella käytetään. OLAP-järjestelmän tulisi käyttää vain niitä tietoja, joita todella tarvitaan, eikä niitä saa käyttää yleinen käytäntö"keittiön suppilo", joka aiheuttaa tarpeettomia syöttöjä.
  4. Jatkuva esitys raportteja kehitettäessä. Esitys kyky luoda raportteja ei saisi heiketä merkittävästi mittojen määrän ja tietokannan koon kasvaessa.
  5. Asiakas-palvelin arkkitehtuuri. Se edellyttää, että tuote ei ole vain asiakas-palvelin, vaan myös palvelinkomponentti on tarpeeksi älykäs, jotta eri asiakkaat voivat muodostaa yhteyden mahdollisimman pienellä vaivalla ja ohjelmoimalla.
  6. Yleinen moniulotteisuus. Kaikkien mittojen on oltava samat, jokaisen ulottuvuuden on oltava samanarvoinen sekä rakenteeltaan että toimintaominaisuuksiltaan. Totta, ylimääräistä toiminnalliset valmiudet yksittäisille mitoille (oletettavasti aika on oletettu), mutta tällainen lisätoiminto on tarjottava mille tahansa ulottuvuudelle. Sen ei pitäisi olla niin perustavanlaatuista Tietorakenteet, laskennalliset tai raportointimuodot olivat täsmällisempiä yhdelle ulottuvuudelle.
  7. Dynaaminen ohjaus harvat matriisit. OLAP-järjestelmien on säädettävä automaattisesti fyysistä skeemansa mallin tyypin, tietomäärien ja tietokannan harvalukuisuuden mukaan.
  8. Monen käyttäjän tuki. OLAP-työkalun on tarjottava ominaisuuksia jakaminen(kysely ja täydennys), eheys ja turvallisuus.
  9. Rajoittamaton ristiintoimintoja. Kaikenlaiset toiminnot on sallittava kaikissa mittauksissa.
  10. Intuitiivinen tietojenkäsittely. Tietojen käsittely suoritettiin suorilla toimilla soluihin katselutilassa ilman valikoita ja useita toimintoja.
  11. Joustavat raportointivaihtoehdot. Mitat tulee sijoittaa raporttiin käyttäjän tarvitsemalla tavalla.
  12. Rajoittamaton

Vuonna 1993 tietokannan rakentamisen relaatiolähestymistavan perustaja Edgar Codd ja hänen kumppaninsa (Edgar Codd, matemaatikko ja IBM-stipendiaatti) julkaisivat Arbor Softwaren (nykyään kuuluisa yritys Hyperion Solutions) aloitteesta artikkelin "Providing OLAP (" online-analyyttinen käsittely) analyyttisille käyttäjille", joka muotoilee 12 ominaisuutta OLAP-tekniikat, joita täydennettiin myöhemmin kuudella muulla. Näistä määräyksistä tuli uuden ja erittäin lupaavan tekniikan pääsisältö.

OLAP-tekniikan pääominaisuudet (Basic):

  • datan moniulotteinen käsitteellinen esitys;
  • intuitiivinen tietojenkäsittely;
  • tietojen saatavuus ja yksityiskohdat;
  • erätietojen poiminta vs. tulkinta;
  • OLAP-analyysimallit;
  • asiakas-palvelin-arkkitehtuuri (OLAP käytettävissä työpöydältä);
  • läpinäkyvyys (avoin pääsy ulkoisiin tietoihin);
  • monen käyttäjän tuki.

Lisäominaisuudet:

  • muotoilemattomien tietojen käsittely;
  • OLAP-tulosten tallentaminen: niiden tallentaminen erillään lähdetiedoista;
  • puuttuvien arvojen poissulkeminen;
  • Puuttuvien arvojen käsittely.

Raportin esityksen ominaisuudet:

  • joustavuus raportoinnissa;
  • standardinmukainen raportoinnin suorituskyky;
  • automaattinen asetus fyysinen tiedonhaun kerros.

Mittojen hallinta:

  • mittausten yleisyys;
  • rajoittamaton määrä ulottuvuuksia ja aggregointitasoja;
  • rajaton määrä operaatioita ulottuvuuksien välillä.

Historiallisesti nykyään termi "OLAP" ei tarkoita vain moniulotteista näkymää loppukäyttäjän tiedoista, vaan myös moniulotteista näkymää kohdetietokannassa olevista tiedoista. Juuri tästä syystä termit "relaatio OLAP" (ROLAP) ja "moniulotteinen OLAP" (MOLAP) esiintyivät itsenäisinä termeinä.

OLAP-palvelu on työkalu suurten tietomäärien analysointiin reaaliajassa. Vuorovaikutuksessa OLAP-järjestelmän kanssa käyttäjä voi tarkastella tietoja joustavasti, hankkia mielivaltaisia ​​tietoviipaleita ja suorittaa analyyttisiä drill-down-, roll-up-, päästä-päähän-jakelu- ja vertailutoimintoja ajan kuluessa käyttämällä useita parametreja samanaikaisesti. Kaikki työ OLAP-järjestelmän kanssa tapahtuu aihepiirin mukaisesti ja mahdollistaa tilastollisesti järkevien mallien rakentamisen liiketoiminnan tilanteesta.

Ohjelmisto OLAP on työkalu varaston sisältämien tietojen operatiiviseen analysointiin. Pääominaisuus on, että nämä työkalut on tarkoitettu alan ei-asiantuntijoiden käyttöön tietotekniikat, ei asiantuntijatilastomies, vaan johtamisen soveltavan alan ammattilainen - osaston, osaston, johdon johtaja ja lopuksi johtaja. Työkalut on suunniteltu mahdollistamaan analyytikko kommunikoimaan ongelman kanssa, ei tietokoneen kanssa. Kuvassa Kuva 6.14 näyttää OLAP-peruskuution, jonka avulla voit arvioida tietoja kolmessa ulottuvuudessa.


Moniulotteinen OLAP-kuutio ja vastaavien matemaattisten algoritmien järjestelmä tilastolliseen käsittelyyn mahdollistavat minkä tahansa monimutkaisuuden datan analysoinnin milloin tahansa.

Riisi. 6.14. Elementaarinen OLAP-kuutio

Koska johtajalla on käytössään joustavat mekanismit tietojen käsittelyä ja visuaalista näyttöä varten (Kuva 6.15, Kuva 6.16), johtaja tutkii ensin eri näkökulmista dataa, joka saattaa liittyä (tai ei välttämättä) liittyy ratkaistavaan ongelmaan.

Seuraavaksi hän vertailee erilaisia ​​liiketoiminnan indikaattoreita keskenään yrittäen tunnistaa piilotettuja suhteita; voi tarkastella tietoja tarkemmin, yksityiskohtaisesti, esimerkiksi jakamalla sen osiin ajan, alueen tai asiakkaan mukaan, tai päinvastoin yleistää edelleen tiedon esitystapaa häiritsevien yksityiskohtien poistamiseksi. Tämän jälkeen konstruoidaan tilastollisen arviointi- ja simulointimoduulin avulla useita vaihtoehtoja tapahtumien kehittämiseen ja niistä valitaan sopivin vaihtoehto.

Riisi. 6.15.

Esimerkiksi yritysjohtajalla voi olla hypoteesi, että omaisuuden kasvun leviäminen yrityksen eri toimialoilla riippuu teknis-taloudellisen koulutuksen omaavien asiantuntijoiden suhteesta. Tämän hypoteesin testaamiseksi johtaja voi pyytää varastosta ja näyttää kaaviossa niiden sivukonttoreiden korkosuhteen, joiden omaisuuden kasvu kuluvalla vuosineljänneksellä laski yli 10 % viime vuoteen verrattuna, ja niille, jotka kasvoivat yli 25 %. Hänen pitäisi pystyä käyttämään yksinkertaista valintaa tarjotusta valikosta. Jos saadut tulokset jakautuvat merkittävästi kahteen vastaavaan ryhmään, tämän pitäisi toimia kannustimena esitetyn hypoteesin testaamiseen edelleen.

Tällä hetkellä dynaamiseksi mallinnus (Dynamic Simulation), joka toteuttaa täysin edellä mainitun FASMI-periaatteen, on kehittynyt nopeasti.

Dynaamisen mallinnuksen avulla analyytikko rakentaa mallin liiketoimintatilanteesta, joka kehittyy ajan myötä tietyn skenaarion mukaan. Lisäksi tällaisen mallinnuksen tuloksena voi olla useita uusia liiketoimintatilanteita, jotka muodostavat puun mahdolliset ratkaisut arvioimalla kunkin todennäköisyyttä ja tulevaisuudennäkymiä.

Riisi. 6.16. Analyyttinen IS tiedon poimimiseen, käsittelyyn ja esittämiseen

Taulukossa 6.3 on esitetty staattisen ja dynaamisen analyysin vertailuominaisuudet.

OLAP-tekniikan käsitteen muotoili Edgar Codd vuonna 1993.

Tämä tekniikka perustuu moniulotteisten tietojoukkojen - ns. OLAP-kuutioiden (ei välttämättä kolmiulotteisten, kuten määritelmästä voisi päätellä) - rakentamiseen. OLAP-teknologioiden käytön tarkoituksena on analysoida dataa ja esittää tämä analyysi sellaisessa muodossa, joka johtohenkilöstön on helppo ymmärtää ja tehdä sen perusteella päätöksiä.

Monimuuttuja-analyysin sovellusten perusvaatimukset:

  • - analyysitulosten antaminen käyttäjälle hyväksyttävässä ajassa (enintään 5 s);
  • - usean käyttäjän pääsy tietoihin;
  • - moniulotteinen tiedon esitys;
  • - mahdollisuus käyttää mitä tahansa tietoa niiden tallennuspaikasta ja tilavuudesta riippumatta.

OLAP-järjestelmätyökalut tarjoavat mahdollisuuden lajitella ja valita tietoja tiettyjen ehtojen mukaan. Voidaan määrittää erilaisia ​​laadullisia ja määrällisiä ehtoja.

Pääasiallinen tietomalli, jota käytetään monissa työkaluja ah tietokantojen luominen ja tuki - DBMS on relaatiomalli. Siinä olevat tiedot esitetään kaksiulotteisten relaatiotaulukoiden joukon muodossa, jotka on yhdistetty avainkentillä. Päällekkäisyyden, epäjohdonmukaisuuden poistamiseksi ja tietokantojen ylläpidon työvoimakustannusten vähentämiseksi käytetään muodollista laitteistoa entiteettitaulukoiden normalisoimiseksi. Sen käyttöön liittyy kuitenkin lisäaika, joka kuluu vastausten luomiseen tietokantakyselyihin, vaikka muistiresursseja säästyy.

Moniulotteinen tietomalli edustaa tutkittavaa kohdetta moniulotteisena kuutiona, kolmiulotteista mallia käytetään useammin. Mitat tai attribuuttien tiedot piirretään kuution akseleita tai pintoja pitkin. Perusattribuutit ovat kuutiosolujen täyttö. Moniulotteinen kuutio voidaan esittää kolmiulotteisten kuutioiden yhdistelmällä havainnoinnin ja esittämisen helpottamiseksi, kun päätöksenteon tukijärjestelmässä luodaan raportointi- ja analyyttisiä asiakirjoja sekä multimediaesityksiä analyyttisiin työmateriaaleihin perustuen.

OLAP-tekniikoiden puitteissa, perustuen siihen tosiasiaan, että tietojen moniulotteinen esitys voidaan järjestää sekä relaatiotietokantajärjestelmien että moniulotteisten erikoistyökalujen avulla, erotetaan kolme tyyppiä moniulotteisia OLAP-järjestelmiä:

  • - moniulotteinen OLAP-MOLAP;
  • - relaatio OLAP-ROLAP;
  • - sekoitettu tai hybridi (Hibridi) OLAP-HOLAP.

Moniulotteisissa DBMS-järjestelmissä dataa ei järjestetä relaatiotaulukoiden muodossa, vaan järjestettyjen moniulotteisten taulukoiden muodossa hyperkuutioiden muodossa, jolloin kaikilla tallennetuilla tiedoilla on oltava sama ulottuvuus, mikä tarkoittaa tarvetta muodostaa täydellisin perusta mitat. Tiedot voidaan järjestää polykuutioiden muodossa, tässä vaihtoehdossa kunkin indikaattorin arvot tallennetaan omilla mitoillaan ja tietojen käsittely tapahtuu järjestelmän omalla työkalulla. Säilytysrakenne on tässä tapauksessa yksinkertaistettu, koska ei ole tarvetta datan tallennusalueelle moniulotteisessa tai oliomuotoisessa muodossa. Valtavat työvoimakustannukset mallien ja järjestelmien luomisessa tietojen muuntamiseksi relaatiomallista objektimalliksi vähenevät.

MOLAPin edut ovat:

  • - nopeampi vastausten vastaanottaminen pyyntöihin kuin ROLAPilla - käytetty aika on yksi tai kaksi suuruusluokkaa vähemmän;
  • - koska SQL-rajoitukset Monien sisäänrakennettujen toimintojen toteuttaminen tulee vaikeaksi.

MOLAPin rajoituksia ovat:

  • - suhteellisen pienet tietokantakoot;
  • - johtuen denormalisoinnista ja esiaggregoinnista moniulotteisia taulukoita käyttää 2,5-100 kertaa enemmän muistia kuin alkuperäiset tiedot (muistin kulutus kasvaa eksponentiaalisesti mittausten määrän kasvaessa);
  • - rajapinnalle ja tiedonkäsittelyvälineille ei ole standardeja;
  • - tietojen lataamisessa on rajoituksia.

Moniulotteisen tiedon luomisen työvoimakustannukset nousevat jyrkästi, koska... Tässä tilanteessa tietovaraston sisältämän tiedon relaatiomallin objektiivistamiseen ei käytännössä ole olemassa erityisiä keinoja. Kyselyjen vastausajat eivät useinkaan täytä OLAP-järjestelmien vaatimuksia.

ROLAP-järjestelmien edut ovat:

  • - kyky analysoida nopeasti suoraan varastossa olevia tietoja, koska useimmat lähdetietokannat ovat relaatioita;
  • - ongelman muuttuvalla ulottuvuudella RO-LAP voittaa, koska tietokannan fyysistä uudelleenjärjestelyä ei tarvita;
  • - ROLAP-järjestelmät voivat käyttää vähemmän tehokkaita asiakasasemia ja palvelimia, ja palvelimet kantavat suurimman taakan monimutkaisten SQL-kyselyjen käsittelystä;
  • - Tietosuojan ja käyttöoikeuksien eriyttämisen taso relaatiotietokantajärjestelmissä on vertaansa vailla korkeampi kuin moniulotteisissa.

ROLAP-järjestelmien haittana on heikompi suorituskyky, tietokantaskeemojen huolellisen kehittämisen tarve, erikoisasetus indeksejä, kyselytilastojen analysointia ja analyysitulosten huomioon ottamista tietokantakaavioita muutettaessa, mikä johtaa merkittäviin lisätyökustannuksiin.

Näiden ehtojen täyttyminen mahdollistaa ROLAP-järjestelmiä käytettäessä MOLAP-järjestelmien kaltaisten indikaattoreiden saavuttamisen käyttöajassa sekä niiden ylittämisen muistinsäästössä.

Hybridi-OLAP-järjestelmät ovat yhdistelmä työkaluja, jotka toteuttavat relaatio- ja moniulotteisen tietomallin. Tämän avulla voit vähentää dramaattisesti tällaisen mallin luomisen ja ylläpidon resurssikustannuksia sekä vastausaikaa pyyntöihin.

Tämä lähestymistapa hyödyntää kahden ensimmäisen lähestymistavan etuja ja kompensoi niiden haitat. Tämä periaate on toteutettu tätä tarkoitusta varten kehitetyissä ohjelmistotuotteissa.

Hybridiarkkitehtuurin käyttö OLAP-järjestelmissä on sopivin tapa ratkaista ohjelmistotyökalujen käyttöön liittyviä ongelmia moniulotteisessa analyysissä.

Kuviontunnistustila perustuu älykkääseen tietojenkäsittelyyn. Päätehtävänä on tunnistaa tutkittavien prosessien malleja, eri tekijöiden suhteita ja keskinäisiä vaikutuksia, etsiä suuria "epätavallisia" poikkeamia ja ennustaa erilaisten merkittävien prosessien kulkua. Tämä alue liittyy tiedon louhintaan.

Suurin ero tosiasioiden ja tiedon välillä on se, että vastaanotamme ja otamme tiedot huomioon ja voimme käyttää tietoa hyödyksemme. Karkeasti sanottuna tieto on analysoitua ja systematisoitua dataa. Oikea-aikaisten tietojen ansiosta monet yritykset selviävät sekä finanssikriisistä että kovimmasta kilpailusta. Ei riitä, että kerätään tosiasiat ja kaikki tarvittavat tiedot. Sinun on myös pystyttävä analysoimaan niitä. Helpottaaksemme tärkeitä liiketoimintapäätöksiä tekevien ihmisten työtä, erilaisia ​​järjestelmiä tuki. Tätä tarkoitusta varten on kehitetty erilaisia ​​monimutkaisia ​​järjestelmiä, joiden avulla voidaan analysoida suuria määriä heterogeenista tietoa ja muuttaa niistä yrityskäyttäjälle hyödyllistä tietoa. Uusi alue liiketoimintaanalytiikan tavoitteena on parantaa liiketoimintajärjestelmien prosessien hallintaa tietovarastojen ja teknologioiden avulla.

Yritystietojärjestelmien markkinat tarjoavat nykyään monipuolisen valikoiman ratkaisuja, jotka auttavat yritystä järjestämään johdon kirjanpitoa, varmistamaan tuotannon ja myynnin operatiivisen hallinnan sekä tehokkaan vuorovaikutuksen asiakkaiden ja toimittajien kanssa.

Liiketoimintajärjestelmämarkkinoilla erillisen markkinaraon ovat analyyttiset ohjelmistotuotteet, jotka on suunniteltu tukemaan päätöksentekoa yrityksen johtamisen strategisella tasolla. Suurin ero tällaisten työkalujen ja operatiivisten johtamisjärjestelmien välillä on se, että jälkimmäiset tarjoavat yrityksen johtamisen "toimintatilassa" eli hyvin määritellyn tuotantoohjelman toteuttamisessa, kun taas strategisen tason analyyttiset järjestelmät auttavat yritysjohtoa tekemään päätöksiä "kehitystila".

Toteutettavien muutosten laajuus voi vaihdella syvällisestä rakennemuutoksesta yksittäisten tuotantolaitosten teknologioiden osittaiseen uudistamiseen, mutta joka tapauksessa päättäjät harkitsevat kehittämisvaihtoehtoja, joista yrityksen kohtalo pitkällä aikavälillä riippuu.

Ei ole väliä kuinka voimakas ja kehittynyt Tietojärjestelmä yrityksille, se ei voi auttaa ratkaisemaan näitä ongelmia, ensinnäkin, koska se on konfiguroitu kiinteisiin, vakiintuneisiin liiketoimintaprosesseihin, ja toiseksi se ei sisällä eikä voi sisältää tietoa päätösten tekemiseksi uusista liiketoiminta-alueista, uusista teknologioista, uusista organisaatioratkaisuista.

OLAP (On-Line Analytical Processing) tietojenkäsittely- ja analyysiteknologian ansiosta mikä tahansa organisaatio voi saada työssään tarvittavat tiedot lähes välittömästi (viiden sekunnin sisällä). OLAP voidaan määritellä lyhyesti viidellä avainsanalla.

FAST (Fast) - tämä tarkoittaa, että aika tarvittavien tietojen etsimiseen ja toimittamiseen vie enintään viisi sekuntia. Yksinkertaisimmat pyynnöt käsitellään sekunnissa, ja muutamien monimutkaisten pyyntöjen käsittelyaika on yli kaksikymmentä sekuntia. Tämän tuloksen saavuttamiseksi käytä erilaisia ​​menetelmiä, erityisistä tiedontallennusmuodoista laajoihin esilaskelmiin. Näin saat hetkessä raportin, jonka valmistelu kesti aiemmin päiviä.

ANALYSIS (Analyyttinen) sanoo, että järjestelmä voi suorittaa minkä tahansa analyysin, sekä tilastollisen että loogisen, ja tallentaa sen sitten saatavilla olevaan muotoon.

JAETTU tarkoittaa, että järjestelmä tarjoaa vaaditun yksityisyyden solutasolle asti

MULTIDIMENSIONAL (Multidimensional) on OLAPin pääominaisuus. Järjestelmän on tuettava täysin hierarkioita ja useita hierarkioita, koska tämä on loogisin tapa analysoida sekä liiketoiminnan että organisaation toimintaa.

TIEDOT. Tarvittavat tiedot tulee toimittaa sinne, missä sitä tarvitaan.

Organisaation toimiessa sen toimialaan liittyvää tietoa kertyy aina, mikä tallentuu joskus aivan eri paikkoihin, ja niiden yhdistäminen on sekä vaikeaa että aikaa vievää. Vuorovaikutteisen analyyttisen tietojenkäsittelyn teknologia eli OLAP on kehitetty nopeuttamaan tiedon hankintaa uusien liiketoimintahypoteesien testaamiseksi. Tällaisten OLAP-järjestelmien päätarkoitus on vastata nopeasti mielivaltaisiin käyttäjien pyyntöihin. Tämä tarve syntyy usein kehitettäessä jotain tärkeää liiketoimintaprojektia, kun kehittäjä tarvitsee nousseen työhypoteesia. Useammin käyttäjän tarvitsema tiedot tulisi esittää jonkinlaisen riippuvuuden muodossa - esimerkiksi kuinka myyntimäärä riippuu tuoteryhmästä, myyntialueesta, vuodenajasta ja niin edelleen. OLAP:n ansiosta hän pystyy välittömästi hankkimaan tarvittavat tiedot halutussa asettelussa valitulle ajanjaksolle.

Vuorovaikutteisen OLAP-tekniikan avulla voit muuntaa valtavia kasoja raportteja ja tietovuoria hyödyllisiksi ja tarkiksi tiedoiksi, jotka auttavat työntekijää tekemään tietoon perustuvia liiketoiminta- tai taloudellisia päätöksiä oikeaan aikaan.

Lisäksi OLAPin ansiosta käsittelyteho kasvaa ja käyttäjä voi vastaanottaa suuria määriä lajiteltua (aggregoitua) tietoa lähes välittömästi. OLAPin ansiosta käyttäjä näkee selvästi, kuinka tehokkaasti hänen organisaationsa toimii ja pystyy reagoimaan nopeasti ja joustavasti. ulkoisia muutoksia, on kyky minimoida taloudellisia menetyksiä organisaatiosi. OLAP tarjoaa tarkkoja tietoja, jotka parantavat tehtyjen päätösten laatua.

Liiketoiminnan analysointijärjestelmien ainoa haittapuoli on niiden korkea hinta. Henkilökohtaisen tietovaraston luominen vaatii sekä aikaa että paljon rahaa.

OLAP-tekniikan käyttö liiketoiminnassa mahdollistaa nopean hankinnan tarvittavat tiedot, joka voidaan käyttäjän pyynnöstä esittää tavallisessa muodossa - raporteissa, kaavioissa tai taulukoissa.

Yritysrakenteiden järjestelmäintegraatiomenettelyt perustuvat yhteisten ERP-, CRM- ja SCM-ratkaisujen käyttöön. Monissa tapauksissa järjestelmät toimitetaan eri valmistajilta, ja tuodut tiedot on harmonisoitava ja esitettävä heterogeenisina tietoina. Liiketoimintaympäristössä on yksiselitteinen vaatimus - tietojen täydellinen analyysi, joka sisältää konsolidoitujen raporttien tarkastelun eri näkökulmista.

Eri valmistajilla on erilaiset tietojen raportointimekanismit. Heterogeeninen esitysmenettely sisältää irrotuksen, muuntamisen ja lataamisen (ETL). Esimerkiksi Microsoft SQL Server 2005 Analysis Servicesissä tietojen yhdistämisongelma on toteutettu käyttämällä Dataa Lähdenäkymät – tietolähteet, jotka kuvaavat analyyttisiä esitysmalleja.

OLAP-teknologioihin perustuvat liiketoimintasovellukset, esimerkkejä tuotteista. OLAP-tekniikoiden yleisimmät sovellukset ovat:

Tietojen analysointi.

Tehtävä, johon suosituimpia OLAP-työkaluja alun perin käytettiin ja on edelleen olemassa. Moniulotteinen tietomalli, kyky analysoida merkittäviä tietomääriä ja nopea vastaus pyyntöihin tekevät tällaisista järjestelmistä välttämättömiä myynnin, markkinoinnin, jakelun ja muiden tehtävien analysointiin suurella määrällä lähdetietoa.

Esimerkkejä tuotteista: Microsoft Excel Pivot Tables, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Taloussuunnittelu-budjetointi.

Moniulotteisen mallin avulla voit syöttää tietoja samanaikaisesti ja analysoida sitä helposti (esimerkiksi suunnitelman fakta-analyysi). Siksi numero nykyaikaiset tuotteet CPM (Corporate Performance Management) -luokka käyttää OLAP% -malleja. Tärkeä tehtävä on moniulotteinen käänteinen laskenta (backsolve, breakback, writeback), jonka avulla voit laskea tarvittavat muutokset yksityiskohtaisissa soluissa, kun aggregoitu arvo muuttuu. Se on työkalu mitä jos -analyysiin, ts. erilaisten tapahtumien vaihtoehtojen pelaamiseen suunnittelun aikana.

Tuoteesimerkkejä: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

Taloudellinen konsolidointi.

Tietojen yhdistäminen mukaan kansainvälisiä standardeja kirjanpito omistusosuudet, eri valuutat ja sisäinen liikevaihto huomioiden - kiireellinen tehtävä tarkastuslaitosten (SOX, Basel II) ja listautuvien yritysten kiristyvien vaatimusten yhteydessä. OLAP-tekniikoiden avulla voit nopeuttaa konsolidoitujen raporttien laskemista ja lisätä koko prosessin läpinäkyvyyttä.

Tuoteesimerkkejä: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Data Warehousing ja On-Line Analytical Processing (OLAP) -tekniikat
ovat tärkeitä osa-alueita yritysten päätöksenteossa, ja niistä on tulossa yhä enemmän olennainen osa kaikkia toimialoja. OLAP-tekniikoiden käyttö liiketoiminta-analyysin työkaluna antaa paremman hallinnan ja oikea-aikaisen pääsyn strategisiin tietoihin
tietoa, joka helpottaa tehokasta päätöksentekoa.
Tämä antaa mahdollisuuden simuloida tosielämän ennusteita ja käyttää resursseja tehokkaammin. OLAPin avulla organisaatio voi vastata nopeammin markkinoiden vaatimuksiin.

Bibliografia:

1. Erik Thomsen. OLAP-ratkaisut: Moniulotteisten tietojärjestelmien rakentaminen, toinen painos. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. OLAP-neuvoston valkoinen kirja, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme ja Bernhard Ganter. Muodollinen käsiteanalyysi _ Matemaattiset perusteet.