OLAP taloushallinnossa. OLAP-järjestelmät Olap-tekniikan erityispiirteitä ovat mm

Tarkoitus kurssityötä on tutkimus OLAP-teknologiasta, sen toteutuksen käsitteestä ja rakenteesta.

SISÄÄN moderni maailma tietokoneverkot ja laskentajärjestelmät mahdollistavat suurten tietomäärien analysoinnin ja käsittelyn.

Suuri tietomäärä vaikeuttaa suuresti ratkaisujen etsimistä, mutta mahdollistaa paljon tarkempien laskelmien ja analyysien tekemisen. Tämän ongelman ratkaisemiseksi on olemassa koko luokka tietojärjestelmiä, jotka suorittavat analyysin. Tällaisia ​​järjestelmiä kutsutaan päätöksen tukijärjestelmiksi (DSS) (Decision Support System).

Analyysin suorittamiseksi DSS:n on kerättävä tietoa, jolla on välineet sen syöttämiseen ja tallentamiseen. Kaiken kaikkiaan voimme erottaa kolme päätehtävää, jotka on ratkaistu DSS:ssä:

· datan syöttö;

· tietovarasto;

· tietojen analysointi.

Tietojen syöttö DSS:ään tapahtuu automaattisesti ympäristön tai prosessin tilaa kuvaavista antureista tai ihmisen toimesta.

Jos tietojen syöttö tapahtuu automaattisesti antureista, tiedot kerätään valmiussignaalilla, joka syntyy tiedon ilmestyessä tai syklisellä pollauksella. Jos syötteen suorittaa henkilö, hänen on tarjottava käyttäjille kätevät keinot tietojen syöttämiseen, niiden syöttämisen oikeellisuuden tarkistamiseen sekä tarvittavien laskelmien suorittamiseen.

Kun useat operaattorit syöttävät tietoja samanaikaisesti, on tarpeen ratkaista saman tiedon muokkaamisen ja rinnakkaisen käytön ongelmat.

DSS tarjoaa analyytikolle tietoja raporttien, taulukoiden, kaavioiden muodossa tutkimusta ja analysointia varten, minkä vuoksi tällaiset järjestelmät tarjoavat päätöksenteon tukitoimintoja.

Tiedonsyöttöalijärjestelmät, joita kutsutaan nimellä OLTP (On-line transaktioiden käsittely), toteuttavat operatiivisen tiedonkäsittelyn. Niiden toteuttamiseen käytetään perinteisiä tietokannanhallintajärjestelmiä (DBMS).

Analyysialijärjestelmä voidaan rakentaa seuraavien pohjalta:

· Tiedonhakuanalyysin alijärjestelmät perustuvat relaatiotietokantaan ja staattisiin kyselyihin SQL-kieli;

· toiminnallisen analyysin osajärjestelmät. Tällaisten alijärjestelmien toteuttamiseen käytetään operatiivisen analyyttisen tietojenkäsittelyn teknologiaa OLAP, jossa käytetään moniulotteisen tiedon esityksen käsitettä;

· älyllisen analyysin osajärjestelmät. Tämä alijärjestelmä toteuttaa DataMining-menetelmiä ja -algoritmeja.

Käyttäjän näkökulmasta OLAP-järjestelmät tarjoavat työkaluja tiedon joustavaan tarkasteluun eri osissa, automaattiseen aggregoitujen tietojen hankkimiseen, analyyttisten konvoluutio-, poraus- ja vertailuoperaatioiden suorittamiseen. Kaiken tämän ansiosta OLAP-järjestelmät ovat ratkaisu, jolla on suuria etuja tiedon valmistelussa kaikenlaiseen liiketoimintaraportointiin, johon sisältyy tietojen esittäminen eri osioissa ja eri hierarkiatasoilla, kuten myyntiraportit, erilaiset budjetit ja muut. OLAP-järjestelmillä on suuria etuja tällaisesta esityksestä muissa data-analyysin muodoissa, mukaan lukien ennustaminen.

1.2 Määritelmä OLAP-järjestelmät

Moniulotteisen data-analyysin tekniikkaa kutsutaan OLAPiksi. OLAP on tietovarastoorganisaation keskeinen osa.

OLAP-toiminnallisuutta voidaan toteuttaa monin eri tavoin, sekä yksinkertaisina, kuten data-analyysin avulla toimistosovelluksissa, että monimutkaisempia - palvelintuotteisiin perustuvia hajautettuja analyyttisiä järjestelmiä.

OLAP (On-LineAnalyticalProcessing) on ​​operatiivisen analyyttisen tiedonkäsittelyn teknologia, joka käyttää työkaluja ja menetelmiä moniulotteisen tiedon keräämiseen, tallentamiseen ja analysointiin päätöksentekoprosessien tueksi.

OLAP-järjestelmien päätarkoitus on tukea käyttäjien analyyttisiä toimintoja ja mielivaltaisia ​​kyselyitä. OLAP-analyysin tarkoituksena on testata esiin nousevia hypoteeseja.

Lähetä hyvä työsi tietokanta on yksinkertainen. Käytä alla olevaa lomaketta

Opiskelijat, jatko-opiskelijat, nuoret tutkijat, jotka käyttävät tietopohjaa opinnoissaan ja työssään, ovat sinulle erittäin kiitollisia.

Lähetetty http://www.allbest.ru/

Kurssityöt

tieteenala: Tietokannat

Aihe: TekniikkaOLAP

Valmistunut:

Tšižikov Aleksandr Aleksandrovitš

Johdanto

1. OLAP-tuotteiden luokittelu

2. OLAP-asiakas - OLAP-palvelin: plussat ja miinukset

3. OLAP-ydinjärjestelmä

3.1 Suunnitteluperiaatteet

Johtopäätös

Luettelo käytetyistä lähteistä

Sovellukset

SISÄÄNjohtaa

Vaikea löytää tietokonemaailmaan henkilö, joka ei ainakaan intuitiivisella tasolla ymmärtänyt, mitä tietokannat ovat ja miksi niitä tarvitaan. Toisin kuin perinteisissä relaatiotietokantajärjestelmissä, OLAP-käsite ei ole niin laajalti tunnettu, vaikka melkein jokainen on luultavasti kuullut salaperäisen termin "OLAP-kuutiot". Mitä on online-analyyttinen käsittely?

OLAP ei ole erillinen ohjelmistotuote, ohjelmointikieli tai edes tietty tekniikka. Jos yritämme kattaa OLAPin sen kaikissa ilmenemismuodoissa, se on joukko käsitteitä, periaatteita ja vaatimuksia, jotka ovat ohjelmistotuotteiden taustalla ja jotka helpottavat analyytikoiden pääsyä tietoihin. Vaikka kukaan ei olisi eri mieltä tällaisesta määritelmästä, on kyseenalaista, että se toisi ei-asiantuntijat hivenen lähemmäksi asian ymmärtämistä. Siksi, kun pyrit ymmärtämään OLAP:ia, on parempi valita toinen polku. Ensinnäkin meidän on selvitettävä, miksi analyytikoiden on jotenkin erityisesti helpotettava pääsyä tietoihin.

Tosiasia on, että analyytikot ovat yritystiedon erityisiä kuluttajia. Analyytikon tehtävänä on löytää kuvioita suurista tietomääristä. Siksi analyytikko ei kiinnitä huomiota yhteen tosiasiaan, hän tarvitsee tietoa sadoista ja tuhansista tapahtumista. Muuten, yksi merkittävistä kohdista, joka johti OLAPin syntymiseen, on tuottavuus ja tehokkuus. Kuvitellaan, mitä tapahtuu, kun analyytikon on hankittava tietoja, mutta yrityksessä ei ole OLAP-työkaluja. Analyytikko tekee itsenäisesti (mikä on epätodennäköistä) tai ohjelmoijan avulla sopivan SQL-kyselyn ja vastaanottaa kiinnostavat tiedot raportin muodossa tai vie ne laskentataulukkoon. Tässä tapauksessa syntyy monia ongelmia. Ensinnäkin analyytikko pakotetaan tekemään jotain muuta kuin työtään (SQL-ohjelmointi) tai odottamaan ohjelmoijien suorittavan tehtävän hänen puolestaan ​​- kaikki tämä vaikuttaa negatiivisesti työn tuottavuuteen, sydänkohtausten ja aivohalvausten määrä kasvaa ja niin edelleen. Toiseksi yksittäinen raportti tai taulukko ei pääsääntöisesti pelasta ajatuksen jättiläisiä ja venäläisen analyysin isiä - ja koko menettely on toistettava uudestaan ​​​​ja uudestaan. Kolmanneksi, kuten olemme jo havainneet, analyytikot eivät kysy pienistä asioista - he tarvitsevat kaiken kerralla. Tämä tarkoittaa (vaikka tekniikka kehittyy harppauksin), että analyytikon käyttämä yrityksen relaatiotietokantapalvelin voi ajatella syvästi ja pitkään ja estää muut tapahtumat.

OLAP-konsepti näytti juuri ratkaisevan tällaiset ongelmat. OLAP kuutiot ovat pohjimmiltaan metaraportteja. Leikkaamalla metaraportteja (eli kuutioita) dimensioiden mukaan analyytikko itse asiassa vastaanottaa häntä kiinnostavat "tavalliset" kaksiulotteiset raportit (nämä eivät välttämättä ole raportteja termin tavallisessa merkityksessä - puhumme tietorakenteista samat toiminnot). Kuutioiden edut ovat ilmeiset - tietoja täytyy pyytää relaatiotietokantajärjestelmästä vain kerran - kuutiota rakennettaessa. Koska analyytikot eivät pääsääntöisesti työskentele lennossa täydennetyn ja muuttuvan tiedon kanssa, luotu kuutio on relevantti melko pitkään. Tämän ansiosta relaatio-DBMS-palvelimen toiminnan keskeytykset eivät ole vain eliminoituneet (ei ole kyselyitä, joissa on tuhansia ja miljoonia vastausrivejä), vaan myös analyytikon itsensä tiedonsaantinopeus kasvaa jyrkästi. Lisäksi, kuten jo todettiin, suorituskykyä parannetaan myös laskemalla hierarkioiden ja muiden aggregoitujen arvojen osasummat kuution rakentamishetkellä.

Tietenkin sinun on maksettava tuottavuuden lisäämisestä tällä tavalla. Joskus sanotaan, että tietorakenne yksinkertaisesti "räjähtää" - OLAP-kuutio voi viedä kymmeniä tai jopa satoja kertoja enemmän tilaa kuin alkuperäinen data.

Nyt kun meillä on vähän ymmärrystä OLAPin toiminnasta ja palvelemisesta, kannattaa silti hieman virallistaa tietämystämme ja antaa OLAP-kriteerit ilman simultaanikäännöstä tavalliselle ihmiskielelle. Nämä kriteerit (yhteensä 12) muotoili vuonna 1993 E.F. Codd - relaatiotietokannan ja samalla OLAP:n käsitteen luoja. Emme ota niitä suoraan huomioon, koska ne on myöhemmin muokattu ns. FASMI-testiksi, joka määrittää OLAP-tuotteiden vaatimukset. FASMI on lyhenne kunkin testikohteen nimestä:

Nopea nopea). Tämä ominaisuus tarkoittaa, että järjestelmän on annettava vastaus käyttäjän pyyntöön keskimäärin viidessä sekunnissa; Useimmat pyynnöt käsitellään kuitenkin yhdessä sekunnissa, ja monimutkaisimmat pyynnöt tulisi käsitellä 20 sekunnissa. Viimeaikaiset tutkimukset ovat osoittaneet, että käyttäjä alkaa epäillä pyynnön onnistumista, jos se kestää yli kolmekymmentä sekuntia.

Analyysi (analyyttinen). Järjestelmän tulee pystyä käsittelemään kaikki liiketoimintasovelluksille tyypilliset loogiset ja tilastolliset analyysit ja varmistamaan, että tulokset säilyvät loppukäyttäjän saatavilla olevassa muodossa. Analyysityökalut voivat sisältää menetelmiä aikasarjojen, kustannusten jakautumisen, valuuttamuunnoksen, organisaatiorakenteiden muutosten mallintamisen ja joidenkin muiden analysoimiseksi.

Jaettu. Järjestelmän tulisi tarjota runsaasti mahdollisuuksia rajoittaa pääsyä tietoihin ja useiden käyttäjien samanaikaista toimintaa.

Moniulotteinen (moniulotteinen). Järjestelmän on tarjottava käsitteellisesti moniulotteinen näkymä tiedoista, mukaan lukien monien hierarkioiden täysi tuki.

Tiedot. Eri ohjelmistotuotteiden tehoa kuvaa käsitellyn syöttötiedon määrä. Eri OLAP-järjestelmillä on erilaiset kapasiteetit: edistyneet OLAP-ratkaisut pystyvät käsittelemään vähintään tuhat kertaa enemmän tietoa kuin vähiten tehokkaimmat. OLAP-työkalua valittaessa on otettava huomioon useita tekijöitä, kuten tietojen kopiointi, muistivaatimukset, levytilan käyttö, suorituskykymittarit, integrointi tietovarastojen kanssa ja niin edelleen.

1. OLAP-tuotteiden luokittelu

Joten OLAPin ydin on, että analyysin tietolähde esitetään moniulotteisena kuutiona, ja sitä on mahdollista mielivaltaisesti manipuloida ja saada tarvittavat tietoosiot - raportit. Tässä tapauksessa loppukäyttäjä näkee kuution moniulotteisena dynaamisena taulukkona, joka automaattisesti tiivistää tiedot (faktat) eri osioihin (ulottuvuuksiin) ja mahdollistaa laskelmien ja raporttien interaktiivisen hallinnan. Nämä toiminnot suorittaa OLAP-moottori (tai OLAP-laskentakone).

Nykyään ympäri maailmaa on kehitetty monia OLAP-teknologioita toteuttavia tuotteita. Niiden välillä navigoinnin helpottamiseksi käytetään OLAP-tuotteiden luokituksia: tietojen tallennusmenetelmän ja OLAP-koneen sijainnin mukaan. Katsotaanpa tarkemmin jokaista OLAP-tuotteiden luokkaa.

Aloitan luokittelulla tietojen tallennusmenetelmän perusteella. Haluan muistuttaa, että moniulotteiset kuutiot rakennetaan lähde- ja aggregaattitietojen perusteella. Kuutioiden lähde- ja aggregaattitiedot voidaan tallentaa sekä relaatio- että moniulotteisiin tietokantoihin. Siksi tällä hetkellä käytetään kolmea tiedon tallennusmenetelmää: MOLAP (Multidimensional OLAP), ROLAP (Relational OLAP) ja HOLAP (Hybrid OLAP). Sen mukaisesti OLAP-tuotteet on jaettu kolmeen samanlaiseen luokkaan tietojen tallennustavan perusteella:

1.MOLAPin tapauksessa lähde- ja aggregaattitiedot tallennetaan moniulotteiseen tietokantaan tai moniulotteiseen paikalliseen kuutioon.

2. ROLAP-tuotteissa lähdetiedot tallennetaan relaatiotietokantoihin tai tasaisiin paikallisiin taulukoihin tiedostopalvelimella. Aggregoidut tiedot voidaan sijoittaa palvelutaulukoihin samassa tietokannassa. Tietojen muuntaminen relaatiotietokannasta moniulotteisiksi kuutioiksi tapahtuu OLAP-työkalun pyynnöstä.

3. HOLAP-arkkitehtuuria käytettäessä lähdetieto säilyy relaatiotietokannassa ja aggregaatit sijoitetaan moniulotteiseen tietokantaan. OLAP-kuutio rakennetaan OLAP-työkalun pyynnöstä perustuen relaatio- ja moniulotteiseen dataan.

Seuraava luokitus perustuu OLAP-koneen sijaintiin. Tämän ominaisuuden perusteella OLAP-tuotteet jaetaan OLAP-palvelimiin ja OLAP-asiakkaisiin:

Palvelimen OLAP-työkaluissa laskelmat ja aggregoidun tiedon tallentaminen suoritetaan erillisellä prosessilla - palvelimella. Asiakassovellus vastaanottaa vain palvelimelle tallennettujen moniulotteisten kuutioiden kyselyjen tulokset. Jotkut OLAP-palvelimet tukevat tietojen tallennusta vain relaatiotietokantoihin, jotkut vain moniulotteisiin tietokantoihin. Monet nykyaikaiset OLAP-palvelimet tukevat kaikkia kolmea tiedon tallennusmenetelmää: MOLAP, ROLAP ja HOLAP.

OLAP-asiakasohjelma on suunniteltu eri tavalla. Moniulotteisen kuution rakentaminen ja OLAP-laskelmat suoritetaan asiakastietokoneen muistissa. OLAP-asiakkaat jaetaan myös ROLAPiin ja MOLAPiin. Ja jotkut saattavat tukea molempia tietojen käyttövaihtoehtoja.

Jokaisella näistä lähestymistavoista on omat hyvät ja huonot puolensa. Vastoin yleistä käsitystä palvelintyökalujen eduista asiakastyökaluihin verrattuna, OLAP-asiakasohjelman käyttäminen käyttäjille voi joissain tapauksissa olla tehokkaampaa ja kannattavampaa kuin OLAP-palvelimen käyttäminen.

2. OLAP-asiakas - OLAP-palvelin: plussat ja miinukset

Rakentaessaan tietojärjestelmä OLAP-toiminnallisuus voidaan toteuttaa sekä palvelimen että asiakkaan OLAP-työkaluilla. Käytännössä valinta on kompromissi suorituskyvyn ja ohjelmistokustannusten välillä.

Tietojen määrä määräytyy seuraavien ominaisuuksien yhdistelmällä: tietueiden lukumäärä, dimensioiden lukumäärä, dimensioelementtien lukumäärä, mittojen pituus ja tosiasioiden määrä. Tiedetään, että OLAP-palvelin pystyy käsittelemään suurempia tietomääriä kuin OLAP-asiakas, jolla on sama tietokoneteho. Tämä johtuu siitä, että OLAP-palvelin tallentaa kiintolevyille moniulotteisen tietokannan, joka sisältää esilaskettuja kuutioita.

Suorittaessaan OLAP-toimintoja asiakasohjelmat suorittavat sille kyselyjä SQL:n kaltaisella kielellä, jolloin ei vastaanoteta koko kuutiota, vaan sen näytettävät fragmentit. OLAP-asiakkaalla on oltava käytön aikana RAM-muisti koko kuution ROLAP-arkkitehtuurin tapauksessa on ensin ladattava muistiin koko kuution laskemiseen käytetty tietojoukko. Lisäksi, kun dimensioiden, tosiasioiden tai ulottuvuusjäsenten määrä kasvaa, aggregaattien määrä kasvaa eksponentiaalisesti. Siten OLAP-asiakkaan käsittelemän tiedon määrä riippuu suoraan käyttäjän PC:n RAM-muistin määrästä.

Huomaa kuitenkin, että useimmat OLAP-asiakkaat tarjoavat hajautettua tietojenkäsittelyä. Siksi käsiteltyjen tietueiden määrää, joka rajoittaa asiakkaan OLAP-työkalun työtä, ei ymmärretä yritystietokannan ensisijaisen tiedon määränä, vaan siitä kootun otoksen kokona. OLAP-asiakas luo pyynnön DBMS:lle, joka kuvaa suodatusehdot ja algoritmin ensisijaisten tietojen alustavaa ryhmittelyä varten. Palvelin etsii, ryhmittelee tietueet ja palauttaa kompaktin valikoiman muita OLAP-laskelmia varten. Tämän otoksen koko voi olla kymmeniä tai satoja kertoja pienempi kuin ensisijaisten, ei-aggregoitujen tietueiden määrä. Tämän seurauksena tällaisen OLAP-asiakkaan tarve PC-resursseissa vähenee merkittävästi.

Lisäksi ulottuvuuksien lukumäärää rajoittavat ihmisen havaintokyky. Tiedetään, että keskivertoihminen voi toimia samanaikaisesti 3-4, enintään 8 ulottuvuudella. Kun dynaamisessa taulukossa on suurempi määrä ulottuvuuksia, tiedon havaitseminen vaikeutuu huomattavasti. Tämä tekijä tulee ottaa huomioon laskettaessa alustavasti OLAP-asiakkaan mahdollisesti vaatimaa RAM-muistia.

Mittojen pituus vaikuttaa myös OLAP-koneen osoiteavaruuden kokoon OLAP-kuutiota laskettaessa. Mitä pidemmät mitat ovat, sitä enemmän resursseja tarvitaan esilajittelun suorittamiseen moniulotteinen matriisi, ja päinvastoin. Vain lyhyet mittaukset lähdetiedoissa ovat toinen argumentti OLAP-asiakkaan puolesta.

Tämän ominaisuuden määräävät kaksi edellä käsiteltyä tekijää: käsitellyn tiedon määrä ja tietokoneiden teho. Kun esimerkiksi dimensioiden määrä kasvaa, kaikkien OLAP-työkalujen suorituskyky heikkenee aggregaattien määrän merkittävän lisääntymisen vuoksi, mutta vähenemisnopeus on erilainen. Osoitetaan tämä riippuvuus kaaviolla.

Kaavio 1. Asiakkaan ja palvelimen OLAP-työkalujen suorituskyvyn riippuvuus tietomäärän kasvusta

OLAP-palvelimen nopeusominaisuudet eivät ole yhtä herkkiä tiedon kasvulle. Tämä selittyy eri tekniikoilla, joilla OLAP-palvelin ja OLAP-asiakas käsittelevät käyttäjän pyyntöjä. Esimerkiksi porauksen aikana OLAP-palvelin käyttää tallennettuja tietoja ja "vetää" tiedot tästä "haarasta". OLAP-asiakasohjelma laskee koko aggregaattijoukon lataushetkellä. Tiettyyn tietomäärään asti palvelin- ja asiakastyökalujen suorituskyky on kuitenkin vertailukelpoinen. OLAP-asiakkaille, jotka tukevat hajautettua laskentaa, suorituskyvyn vertailukelpoisuus voi ulottua tietomääriin, jotka kattavat valtavan määrän käyttäjiä OLAP-analyysitarpeet. Tämän vahvistavat MS OLAP Serverin ja OLAP-asiakkaan "Kontur Standard" sisäisen testauksen tulokset. Testi suoritettiin IBM PC Pentium Celeron 400 MHz, 256 Mb näytteelle 1 miljoonasta ainutlaatuisesta (eli koostetusta) tietueesta, jossa oli 7 ulottuvuutta ja jotka sisältävät 10 - 70 jäsentä. Kuution latausaika ei molemmissa tapauksissa ylitä 1 sekuntia, ja erilaiset OLAP-toiminnot (poraa ylös, poraa alas, siirrä, suodata jne.) valmistuvat sekunnin sadasosissa.

Kun näytekoko ylittää RAM-muistin määrän, levyn vaihto alkaa ja OLAP-asiakkaan suorituskyky laskee jyrkästi. Vasta tästä hetkestä lähtien voimme puhua OLAP-palvelimen eduista.

On muistettava, että "murtokohta" määrittää rajan OLAP-ratkaisun kustannusten jyrkälle nousulle. Kunkin tietyn käyttäjän tehtävien osalta tämä kohta on helppo määrittää OLAP-asiakkaan suorituskykytesteillä. Tällaisia ​​testejä voi saada kehitysyhtiöltä.

Lisäksi palvelin-OLAP-ratkaisun hinta nousee käyttäjien määrän kasvaessa. Tosiasia on, että OLAP-palvelin suorittaa laskelmia kaikille käyttäjille yhdessä tietokoneessa. Vastaavasti kuin enemmän määrää käyttäjille, sitä enemmän RAM-muistia ja prosessointitehoa. Siten, jos käsiteltävien tietojen määrät ovat palvelin- ja asiakasjärjestelmien vertailukelpoisen suorituskyvyn alueella, OLAP-asiakkaan käyttö on kannattavampaa, jos muut asiat ovat samat.

OLAP-palvelimen käyttäminen "klassisessa" ideologiassa sisältää relaatiotietokantatietojen lataamisen moniulotteiseen tietokantaan. Lataus suoritetaan tietyn ajanjakson aikana, joten OLAP-palvelimen tiedot eivät vastaa nykyistä tilaa. Vain ne OLAP-palvelimet, jotka tukevat ROLAP-toimintatilaa, ovat vapaita tästä haitasta.

Samoin useat OLAP-asiakkaat mahdollistavat ROLAP- ja Desktop-arkkitehtuurien toteuttamisen suoralla pääsyllä tietokantaan. Tämä varmistaa lähdetietojen online-analyysin.

OLAP-palvelin näyttää vähimmäisvaatimukset asiakaspäätteiden tehoon. Objektiivisesti OLAP-asiakkaan vaatimukset ovat korkeammat, koska... se suorittaa laskelmia käyttäjän PC:n RAM-muistissa. Tietyn organisaation laitekannan tila on tärkein indikaattori, joka on otettava huomioon valittaessa OLAP-työkalua. Mutta tässä on myös "edut" ja "haitat". OLAP-palvelin ei käytä nykyajan valtavaa laskentatehoa henkilökohtaiset tietokoneet. Jos organisaatiolla on jo nykyaikaisia ​​tietokoneita, on tehotonta käyttää niitä vain näyttöpäätteinä ja samalla aiheuttaa lisäkustannuksia keskuspalvelimelle.

Jos käyttäjien tietokoneiden teho "jättää paljon toivomisen varaa", OLAP-asiakas toimii hitaasti tai ei pysty toimimaan ollenkaan. Yhden tehokkaan palvelimen ostaminen voi olla halvempaa kuin kaikkien tietokoneiden päivittäminen.

Tässä on hyödyllistä ottaa huomioon laitteistokehityksen trendit. Koska analysoitavan tiedon määrä on käytännössä vakio, PC:n tehon tasainen kasvu johtaa OLAP-asiakkaiden ominaisuuksien laajentumiseen ja niiden OLAP-palvelimien siirtymiseen erittäin suurten tietokantojen segmenttiin.

Käytettäessä OLAP-palvelinta verkon yli vain näytettävät tiedot siirretään asiakkaan tietokoneelle, kun taas OLAP-asiakas vastaanottaa koko ensisijaisen tiedon määrän.

Siksi verkkoliikenne on suurempi, jos käytetään OLAP-asiakasta.

Mutta OLAP-palvelinta käytettäessä käyttäjän toiminnot, esimerkiksi yksityistäminen, tuottavat uusia kyselyitä moniulotteiseen tietokantaan ja siten uuden tiedonsiirron. OLAP-asiakkaan suorittama OLAP-toimintojen suorittaminen tapahtuu RAM-muistissa, eikä se siten aiheuta uusia tietovirtoja verkossa.

On myös huomattava, että nykyaikainen verkkolaitteisto tarjoaa korkeatasoinen kaistanleveys.

Siksi suurimmassa osassa tapauksista "keskikokoisen" tietokannan analysointi OLAP-asiakkaalla ei hidasta käyttäjän työtä.

OLAP-palvelimen hinta on melko korkea. Tähän olisi sisällytettävä myös erillisen tietokoneen kustannukset ja moniulotteisen tietokannan jatkuvat hallintakustannukset. Lisäksi OLAP-palvelimen käyttöönotto ja ylläpito vaatii varsin korkeasti koulutettua henkilöstöä.

OLAP-asiakkaan hinta on suuruusluokkaa pienempi kuin OLAP-palvelimen hinta. Palvelin ei vaadi hallintaa tai teknisiä lisälaitteita. Henkilöstön pätevyydelle ei ole korkeita vaatimuksia OLAP-asiakkaan käyttöönotossa. OLAP-asiakas voidaan toteuttaa paljon nopeammin kuin OLAP-palvelin.

Analyyttisten sovellusten kehittäminen asiakas-OLAP-työkaluilla on nopea prosessi eikä vaadi erityiskoulutusta. Tietokannan fyysisen toteutuksen tunteva käyttäjä voi kehittää analyyttisen sovelluksen itsenäisesti ilman IT-asiantuntijaa. Kun käytät OLAP-palvelinta, sinun on opittava käyttämään kahta eri järjestelmää, joskus eri toimittajilta - luomaan kuutioita palvelimelle ja kehittämään asiakassovellusta. OLAP-asiakas tarjoaa yhden visuaalisen käyttöliittymän kuutioiden kuvaamiseen ja käyttöliittymien määrittämiseen niille.

Käydään läpi OLAP-sovelluksen luontiprosessi asiakastyökalulla.

Kaavio 2. OLAP-sovelluksen luominen ROLAP-asiakastyökalulla

ROLAP-asiakkaiden toimintaperiaate on semanttisen kerroksen alustava kuvaus, jonka taakse lähdetiedon fyysinen rakenne on piilotettu. Tässä tapauksessa tietolähteitä voivat olla: paikalliset taulukot, RDBMS. Tuettujen tietolähteiden luettelo määräytyy tietyn ohjelmistotuotteen mukaan. Tämän jälkeen käyttäjä voi itsenäisesti käsitellä aihealueensa suhteen ymmärtämiään objekteja kuutioiden ja analyyttisten rajapintojen luomiseksi.

OLAP-palvelinasiakkaan toimintaperiaate on erilainen. OLAP-palvelimessa käyttäjä manipuloi tietokannan fyysisiä kuvauksia luodessaan kuutioita.

Samanaikaisesti itse kuutioon luodaan mukautettuja kuvauksia. OLAP-palvelinasiakas on määritetty vain kuutiolle.

Selvitetään ROLAP-asiakkaan toimintaperiaate dynaamisen myyntiraportin luomisen esimerkin avulla (katso kaavio 2). Tallennetaan analyysin alkutiedot kahteen taulukkoon: Myynti ja Deal.

Semanttista kerrosta luotaessa tietolähteet - Myynti- ja Deal-taulukot - kuvataan termeillä, jotka loppukäyttäjä voi ymmärtää ja muuttaa "tuotteiksi" ja "tarjouksiksi". "Tuotteet"-taulukon "ID"-kenttä nimetään uudelleen nimellä "Koodi" ja "Nimi" nimellä "Tuote" jne.

Sitten luodaan Myynti-liiketoimintaobjekti. Liikeobjekti on tasainen pöytä, jonka pohjalta muodostetaan moniulotteinen kuutio. Liiketoimintaobjektia luotaessa tuotteen "Koodi"-kenttä yhdistää "Tuotteet"- ja "Tapahtumat"-taulukot. Koska kaikkia taulukon kenttiä ei vaadita näytettäväksi raportissa, liiketoimintaobjekti käyttää vain "Tuote", "Päivämäärä" ja "Summa" -kenttiä.

Seuraavaksi luodaan OLAP-raportti liiketoimintaobjektin perusteella. Käyttäjä valitsee liiketoimintaobjektin ja vetää sen attribuutit raporttitaulukon sarake- tai rivialueille. Esimerkissämme "Myynti"-liiketoimintaobjektin perusteella luotiin raportti tuotemyynnistä kuukausittain.

Vuorovaikutteisen raportin parissa työskennellessään käyttäjä voi asettaa suodatus- ja ryhmittelyehdot samoilla yksinkertaisilla hiiren liikkeillä. Tässä vaiheessa ROLAP-asiakas käyttää välimuistissa olevia tietoja. OLAP-palvelinasiakasohjelma luo uuden kyselyn moniulotteiseen tietokantaan. Esimerkiksi käyttämällä myyntiraportissa tuotekohtaista suodatinta saat raportin meitä kiinnostavien tuotteiden myynnistä.

Kaikki OLAP-sovellusasetukset voidaan tallentaa erityiseen metatietosäilöön, sovellukseen tai moniulotteiseen tietokantajärjestelmän arkistoon. Käyttöönotto riippuu tietystä ohjelmistotuotteesta.

Joten missä tapauksissa OLAP-asiakkaan käyttö voi olla käyttäjille tehokkaampaa ja kannattavampaa kuin OLAP-palvelimen käyttö?

OLAP-palvelimen käytön taloudellinen kannattavuus syntyy, kun tietomäärät ovat erittäin suuria ja ylivoimaisia ​​OLAP-asiakkaalle, muuten jälkimmäisen käyttö on perusteltua. Tässä tapauksessa OLAP-asiakasohjelmassa yhdistyvät korkeat suorituskykyominaisuudet ja alhaiset kustannukset.

Tehokkaat tietokoneet analyytikoille ovat toinen argumentti OLAP-asiakkaiden puolesta. OLAP-palvelinta käytettäessä näitä kapasiteettia ei käytetä. OLAP-asiakkaiden etuja ovat seuraavat:

OLAP-asiakkaan käyttöönotto- ja ylläpitokustannukset ovat huomattavasti alhaisemmat kuin OLAP-palvelimen kustannukset.

Kun OLAP-asiakasta käytetään sulautetun koneen kanssa, tiedot siirretään verkon yli kerran. OLAP-toimintoja suoritettaessa uusia tietovirtoja ei luoda.

ROLAP-asiakkaiden määrittämistä yksinkertaistaa poistamalla välivaihe - moniulotteisen tietokannan luominen.

3. OLAP-ydinjärjestelmä

3.1 Suunnitteluperiaatteet

sovellusasiakkaan ydintiedot

Jo sanotun perusteella on selvää, että OLAP-mekanismi on yksi suosituimmista data-analyysimenetelmistä nykyään. Tämän ongelman ratkaisemiseksi on kaksi päätapaa. Ensimmäinen niistä on nimeltään Multidimensional OLAP (MOLAP) - mekanismin toteuttaminen moniulotteisen tietokannan avulla palvelinpuolella ja toista Relational OLAP (ROLAP) - kuutioiden rakentaminen lennossa. SQL-pohjainen kyselyitä relaatiotietokantajärjestelmään. Jokaisella näistä lähestymistavoista on hyvät ja huonot puolensa. Heidän vertaileva analyysi ei kuulu tämän työn piiriin. Tässä kuvataan vain työpöydän ROLAP-moduulin ydintoteutus.

Tämä tehtävä syntyi Borland Delphiin sisältyvien Decision Cube -komponenttien pohjalta rakennetun ROLAP-järjestelmän käytön jälkeen. Valitettavasti tämän komponenttijoukon käyttö osoitti huonoa suorituskykyä suurilla tietomäärillä. Tätä ongelmaa voidaan lieventää yrittämällä leikata mahdollisimman paljon tietoa ennen kuin se syötetään kuutioiksi. Mutta tämä ei aina riitä.

Internetistä ja lehdistä löytyy paljon tietoa OLAP-järjestelmistä, mutta lähes missään ei kerrota miten se toimii sisällä.

Työsuunnitelma:

Työpöydän OLAP-järjestelmän yleinen toimintakaavio voidaan esittää seuraavasti:

Kaavio 3. Työpöydän OLAP-järjestelmän toiminta

Toiminta-algoritmi on seuraava:

1. Tietojen hankkiminen tasaisen taulukon muodossa tai SQL-kyselyn suorittamisen tuloksena.

2. Tietojen tallentaminen välimuistiin ja sen muuntaminen moniulotteiseksi kuutioksi.

3. Muodostetun kuution näyttäminen ristikkäisen välilehden tai kaavion avulla jne. Yleensä yhteen kuutioon voidaan liittää mielivaltainen määrä näkymiä.

Pohditaan, kuinka tällainen järjestelmä voidaan järjestää sisäisesti. Aloitamme siltä puolelta, joka voidaan nähdä ja koskettaa, eli näytöiltä. OLAP-järjestelmissä käytetyt näytöt ovat useimmiten kahdenlaisia ​​- ristikkäisiä välilehtiä ja kaavioita. Tarkastellaan ristitaulukkoa, joka on perus- ja yleisin tapa näyttää kuutio.

Alla olevassa kuvassa aggregoidut tulokset sisältävät rivit ja sarakkeet näkyvät keltaisina, faktoja sisältävät solut vaaleanharmaina ja mittatietoja sisältävät solut tummanharmaina.

Näin ollen taulukko voidaan jakaa seuraavat elementit, jonka kanssa työskentelemme jatkossa:

Kun täytämme matriisin faktoilla, meidän on toimittava seuraavasti:

Määritä mittaustietojen perusteella matriisiin lisättävän elementin koordinaatit.

Määritä niiden summien sarakkeiden ja rivien koordinaatit, joihin lisätty elementti vaikuttaa.

Lisää elementti matriisiin ja vastaaviin sarakkeiden ja rivien kokonaismäärään.

On huomattava, että tuloksena oleva matriisi on hyvin harva, minkä vuoksi sen järjestäminen kaksiulotteisen taulukon muodossa (pinnalla oleva vaihtoehto) ei ole vain järjetöntä, vaan todennäköisimmin mahdotonta suuren matriisin vuoksi. Tämän matriisin dimensio, jonka tallentamiseen ei ole Mikään määrä RAM-muistia ei riitä. Jos kuutiomme sisältää esimerkiksi tietoja yhden vuoden myynnistä ja jos siinä on vain 3 ulottuvuutta - Asiakkaat (250), Tuotteet (500) ja Päivämäärä (365), niin saamme faktamatriisin, jonka mitat ovat seuraavat: numero elementtien = 250 x 500 x 365 = 45 625 000. Ja tämä huolimatta siitä, että matriisissa voi olla vain muutama tuhat täytettyä elementtiä. Lisäksi mitä suurempi määrä ulottuvuuksia, sitä harvempi matriisi on.

Siksi, jotta voit työskennellä tämän matriisin kanssa, sinun on käytettävä erityisiä mekanismeja harvojen matriisien kanssa työskentelemiseen. Harvamatriisin järjestämiseen on useita vaihtoehtoja. Ne on kuvattu melko hyvin ohjelmointikirjallisuudessa, esimerkiksi Donald Knuthin klassisen kirjan "The Art of Programming" ensimmäisessä osassa.

Tarkastellaan nyt, kuinka voimme määrittää tosiasian koordinaatit, kun tiedämme sitä vastaavat mitat. Tätä varten tarkastellaan lähemmin otsikkorakennetta:

Tässä tapauksessa voit helposti löytää tavan määrittää vastaavan solun numerot ja summat, joihin se kuuluu. Tässä voidaan ehdottaa useita lähestymistapoja. Yksi on käyttää puuta vastaavien solujen etsimiseen. Tämä puu voidaan rakentaa kulkemalla valinnan läpi. Lisäksi voidaan helposti määritellä analyyttinen toistuvuuskaava tarvittavan koordinaatin laskemiseksi.

Taulukkoon tallennetut tiedot on muunnettava, jotta niitä voidaan käyttää. Siten suorituskyvyn parantamiseksi hyperkuutiota rakennettaessa on toivottavaa löytää ainutlaatuisia elementtejä, jotka on tallennettu sarakkeisiin, jotka ovat kuution mittoja. Lisäksi voit suorittaa alustavan faktojen yhdistämisen tietueille, joilla on samat ulottuvuusarvot. Kuten edellä mainittiin, mittauskenttien ainutlaatuiset arvot ovat meille tärkeitä. Sitten voidaan ehdottaa seuraavaa rakennetta niiden säilyttämiseen:

Kaavio 4. Varastointirakenne ainutlaatuisia arvoja

Käyttämällä tätä rakennetta vähennämme muistin tarvetta merkittävästi. Mikä on varsin relevanttia, koska... Toimintanopeuden lisäämiseksi on suositeltavaa tallentaa tiedot RAM-muistiin. Lisäksi voit tallentaa vain joukon elementtejä ja tyhjentää niiden arvot levylle, koska tarvitsemme niitä vain ristikkäisvälilehden näyttämisen yhteydessä.

Edellä kuvatut ideat olivat perusta CubeBase-komponenttikirjaston luomiselle.

Kaavio 5. CubeBase-komponenttikirjaston rakenne

TСubeSource suorittaa välimuistin tallentamisen ja tietojen muuntamisen sisäiseen muotoon sekä alustavan tietojen yhdistämisen. TCubeEngine-komponentti suorittaa hyperkuutiolaskelmia ja -toimintoja sen kanssa. Itse asiassa se on OLAP-moottori, joka muuntaa litteän taulukon moniulotteiseksi tietojoukoksi. TCubeGrid-komponentti näyttää ristikkotaulukon ja ohjaa hyperkuution näyttöä. TСubeChart antaa sinun nähdä hyperkuution kaavioiden muodossa, ja TСubePivote-komponentti ohjaa kuution ytimen toimintaa.

Joten tarkastelin niiden komponenttien arkkitehtuuria ja vuorovaikutusta, joita voidaan käyttää OLAP-koneen rakentamiseen. Katsotaanpa nyt tarkemmin sisäinen organisaatio komponentit.

Järjestelmän ensimmäinen vaihe on tietojen lataaminen ja muuntaminen sisäiseen muotoon. Looginen kysymys olisi: miksi tämä on välttämätöntä, koska voit yksinkertaisesti käyttää litteän taulukon tietoja tarkastelemalla sitä kuutioviipaletta rakentaessasi. Vastatakseen tähän kysymykseen, katsotaan taulukkorakennetta OLAP-koneen näkökulmasta. OLAP-järjestelmissä taulukon sarakkeet voivat olla joko faktoja tai ulottuvuuksia. Näiden sarakkeiden kanssa työskentelyn logiikka on kuitenkin erilainen. Hyperkuutiossa mitat ovat itse asiassa akseleita, ja mitta-arvot ovat näiden akseleiden koordinaatteja. Tässä tapauksessa kuutio täyttyy erittäin epätasaisesti - tulee koordinaattiyhdistelmiä, jotka eivät vastaa yhtään tietuetta ja on yhdistelmiä, jotka vastaavat useita alkuperäisen taulukon tietueita, ja ensimmäinen tilanne on yleisempi, eli , kuutio on samanlainen kuin maailmankaikkeus - tyhjä tila, joissakin paikoissa on pisteryhmiä (faktoja). Jos siis me bootstrap Jos esiaggregoimme tiedot, eli yhdistämme tietueita, joilla on samat mittausarvot, samalla kun laskemme alustavia aggregoituja fakta-arvoja, niin jatkossa joudumme työskentelemään vähemmän tietueita, mikä lisää työn nopeutta ja vähentää RAM-muistin vaatimukset.

Hyperkuution osien rakentamiseen tarvitsemme seuraavat ominaisuudet - koordinaattien (todellisuudessa mittausarvojen) määrittely taulukkotietueille sekä tietueiden määrittely, joilla on tietyt koordinaatit (mittausarvot). Pohditaan, kuinka nämä mahdollisuudet voidaan toteuttaa. Helpoin tapa tallentaa hyperkuutio on käyttää oman sisäisen muotonsa tietokantaa.

Kaavamaisesti muunnokset voidaan esittää seuraavasti:

Kuva 6: Sisäisen muotoisen tietokannan muuntaminen normalisoiduksi tietokannaksi

Eli yhden taulukon sijasta saimme normalisoidun tietokannan. Itse asiassa normalisointi vähentää järjestelmän nopeutta, tietokantaasiantuntijat voivat sanoa, ja tässä he ovat varmasti oikeassa siinä tapauksessa, että meidän on saatava arvot sanakirjaelementeille (meidän tapauksessamme mittausarvot). Mutta asia on, että emme tarvitse näitä arvoja ollenkaan siivun rakentamisvaiheessa. Kuten edellä mainittiin, olemme kiinnostuneita vain hyperkuutiomme koordinaateista, joten määritämme koordinaatit mittausarvoille. Helpoin tapa on numeroida elementin arvot uudelleen. Jotta numerointi olisi yksiselitteinen yhden ulottuvuuden sisällä, lajittelemme ensin dimensioarvoluettelot (tietokantatermeillä sanakirjat) aakkosjärjestykseen. Lisäksi numeroidaan tosiasiat uudelleen, ja tosiasiat on koottu valmiiksi. Saamme seuraavan kaavion:

Kaavio 7. Normalisoidun tietokannan uudelleennumerointi mittausarvojen koordinaattien määrittämiseksi

Nyt ei jää muuta kuin yhdistää eri taulukoiden elementit toisiinsa. Relaatiotietokantojen teoriassa tämä tehdään erityisillä välitaulukoilla. Riittää, kun liitämme mittataulukoiden jokaisen merkinnän luetteloon, jonka elementit ovat niiden tosiasioiden lukumäärät, joiden muodostuksessa näitä mittauksia käytettiin (eli määrittämään kaikki tosiasiat, joilla on sama arvo tämän mittauksen kuvaama koordinaatti). Tosiasioissa jokainen tietue sovitetaan niiden koordinaattien arvoihin, joita pitkin se sijaitsee hyperkuutiossa. Hyperkuution tietueen koordinaatit ymmärretään jatkossa vastaavien tietueiden numeroiksi mittausarvotaulukoissa. Sitten hypoteettiselle esimerkillemme saadaan seuraava joukko, joka määrittää hyperkuution sisäisen esityksen:

Kaavio 8. Hyperkuution sisäinen esitys

Tämä on sisäinen esitys hyperkuutiosta. Koska emme tee sitä relaatiotietokantaa varten, käytämme yksinkertaisesti muuttuvan pituisia kenttiä mittausarvojen yhdistämiskenttinä (emme pystyisi tekemään tätä RDB:ssä, koska taulukon sarakkeiden määrä on siellä ennalta määrätty).

Voisimme yrittää käyttää joukkoa väliaikaisia ​​taulukoita hyperkuution toteuttamiseen, mutta tämä menetelmä antaa liian alhaisen suorituskyvyn (esimerkiksi joukko Decision Cube -komponentteja), joten käytämme omia tietotallennusrakenteitamme.

Hyperkuution toteuttamiseksi meidän on käytettävä tietorakenteita, jotka takaavat maksimaalisen suorituskyvyn ja minimaalisen RAM-kulutuksen. Ilmeisesti päärakenteemme ovat sanakirjojen ja tietotaulukoiden tallentamista varten. Katsotaanpa tehtäviä, jotka sanakirjan on suoritettava suurimmalla nopeudella:

elementin läsnäolon tarkistaminen sanakirjassa;

elementin lisääminen sanakirjaan;

etsi tietuenumeroita, joilla on tietty koordinaattiarvo;

etsi koordinaatteja mittausarvon perusteella;

mittausarvon etsiminen sen koordinaatin perusteella.

Näiden vaatimusten toteuttamiseksi voit käyttää Erilaisia ​​tyyppejä ja tietorakenteet. Voit esimerkiksi käyttää rakenteita. Todellisuudessa nämä taulukot vaativat ylimääräisiä indeksointimekanismeja, jotka nopeuttavat tietojen lataamista ja tiedon hakua.

Hyperkuution toiminnan optimoimiseksi on tarpeen määrittää, mitkä tehtävät on ratkaistava ensisijaisesti ja millä kriteereillä meidän on parannettava työn laatua. Meille tärkeintä on lisätä ohjelman nopeutta, kun taas on toivottavaa, että RAM-muistia ei tarvita kovin paljon. Suorituskyvyn lisääminen on mahdollista ottamalla käyttöön lisämekanismeja tietojen saamiseksi, esimerkiksi ottamalla käyttöön indeksointi. Valitettavasti tämä lisää RAM-muistia. Siksi määritämme, mitkä toiminnot meidän on suoritettava suurimmalla nopeudella. Voit tehdä tämän harkitsemalla yksittäisiä komponentteja, toteuttaa hyperkuution. Näillä komponenteilla on kaksi päätyyppiä - mitta- ja faktataulukko. Mittausta varten tyypillinen tehtävä tahtoa:

uuden arvon lisääminen;

määritetään koordinaatti mittausarvon perusteella;

arvon määrittäminen koordinaatilla.

Kun lisäät uutta elementtiarvoa, meidän on tarkistettava, onko meillä jo sellainen arvo, ja jos on, älä lisää uutta, vaan käytä olemassa olevaa koordinaattia, muuten meidän on lisättävä uusi elementti ja määritettävä sen koordinaatti. Tätä varten tarvitset tavan löytää nopeasti halutun elementin läsnäolo (lisäksi tällainen ongelma ilmenee määritettäessä koordinaattia elementin arvolla). Tätä tarkoitusta varten on optimaalista käyttää tiivistystä. Tässä tapauksessa optimaalinen rakenne olisi käyttää hash-puita, joihin tallennamme viittaukset elementteihin. Tässä tapauksessa elementit ovat mittasanakirjan rivejä. Sitten mittausarvon rakenne voidaan esittää seuraavasti:

PFactLink = ^TFactLink;

TFactLink = tietue

Faktanro: kokonaisluku; // faktaindeksi taulukossa

TDimensionRecord = tietue

Arvo: merkkijono; // mittausarvo

Indeksi: kokonaisluku; // koordinaattiarvo

FactLink: PFactLink; // osoitin tietotaulukon elementtien luettelon alkuun

Ja hash-puuhun tallennamme linkkejä ainutlaatuisiin elementteihin. Lisäksi meidän on ratkaistava käänteisen muunnoksen ongelma - käyttämällä koordinaattia mittausarvon määrittämiseen. Tarjota maksimi suorituskyky sinun on käytettävä suoraa osoitetta. Siksi voit käyttää toista taulukkoa, jonka indeksi on dimension koordinaatti ja arvo on linkki vastaavaan sanakirjaan. Voit kuitenkin tehdä sen helpommin (ja säästää muistia), jos järjestät elementtijoukon vastaavasti siten, että elementin indeksi on sen koordinaatti.

Faktalistan toteuttavan taulukon järjestäminen ei aiheuta erityisiä ongelmia sen yksinkertaisen rakenteen vuoksi. Ainoa huomautus olisi, että on suositeltavaa laskea kaikki aggregointimenetelmät, joita voidaan tarvita ja jotka voidaan laskea asteittain (esimerkiksi summa).

Joten olemme kuvanneet menetelmän tietojen tallentamiseksi hyperkuution muodossa. Sen avulla voit luoda joukon pisteitä moniulotteisessa tilassa tietovarastossa olevien tietojen perusteella. Jotta henkilö voi työskennellä näiden tietojen kanssa, ne on esitettävä helposti käsiteltävässä muodossa. Tässä tapauksessa pivot-taulukkoa ja kaavioita käytetään tietojen esittämisen päätyypeinä. Lisäksi molemmat menetelmät ovat itse asiassa hyperkuution projektioita. Varmistaaksemme maksimaalisen tehokkuuden esitysten rakentamisessa, lähdemme siitä, mitä nämä projektiot edustavat. Aloitetaan pivot-taulukosta, joka on tärkein data-analyysin kannalta.

Etsitään tapoja toteuttaa tällainen rakenne. Pivot-taulukon muodostavat kolme osaa: riviotsikot, sarakeotsikot ja varsinainen koottujen fakta-arvojen taulukko. Eniten yksinkertaisella tavalla Faktataulukkonäkymässä käytetään kaksiulotteista taulukkoa, jonka ulottuvuus voidaan määrittää rakentamalla otsikot. Valitettavasti yksinkertaisin menetelmä on tehottomin, koska taulukko tulee olemaan erittäin harva ja muistia käytetään erittäin tehottomasti, minkä seurauksena on mahdollista rakentaa vain hyvin pieniä kuutioita, koska muuten niitä ei ehkä ole tarpeeksi muisti. Siksi meidän on valittava tietorakenne tarjottavan tiedon tallentamiseksi suurin nopeus uuden elementin etsiminen/lisääminen ja samalla minimaalinen RAM-muistin kulutus. Tämä rakenne on ns. harvat matriisit, joista voit lukea tarkemmin Knuthilta. Matriisin järjestämiseen on useita tapoja. Jotta voimme valita meille sopivan vaihtoehdon, harkitsemme ensin taulukon otsikoiden rakennetta.

Otsikoilla on selkeä hierarkkinen rakenne, joten olisi luonnollista olettaa, että ne tallennetaan puuhun. Tässä tapauksessa puusolmun rakenne voidaan kuvata kaavamaisesti seuraavasti:

Liite C

Tässä tapauksessa on loogista tallentaa linkki moniulotteisen kuution dimensiotaulukon vastaavaan elementtiin dimensioarvona. Tämä vähentää muistikustannuksia osion tallentamisesta ja nopeuttaa työtä. Linkkejä käytetään myös ylä- ja alasolmuina.

Jotta voit lisätä elementin puuhun, sinulla on oltava tiedot sen sijainnista hyperkuutiossa. Tällaisena tietona sinun on käytettävä sen koordinaattia, joka on tallennettu mittausarvosanakirjaan. Katsotaanpa kaaviota elementin lisäämiseksi pivot-taulukon otsikkopuuhun. Tässä tapauksessa käytämme lähtötietona mittauskoordinaattien arvoja. Järjestys, jossa nämä dimensiot on lueteltu, määräytyy halutun aggregointimenetelmän mukaan ja vastaa otsikkopuun hierarkiatasoja. Työn tuloksena sinun on hankittava luettelo pivot-taulukon sarakkeista tai riveistä, joihin sinun on lisättävä elementti.

SovellusD

Käytämme mittauskoordinaatteja lähtötietona tämän rakenteen määrittämiseen. Lisäksi oletamme varmuuden vuoksi, että määrittelemme meitä kiinnostavan sarakkeen matriisissa (pohdimme kuinka määritellä rivi hieman myöhemmin, koska siellä on kätevämpää käyttää muita tietorakenteita; syy tämä valinta on myös katso alla). Koordinaateina otamme kokonaislukuja - mittausarvojen lukumäärät, jotka voidaan määrittää edellä kuvatulla tavalla.

Joten tämän toimenpiteen suorittamisen jälkeen saamme joukon viittauksia harvaan matriisin sarakkeisiin. Nyt sinun on suoritettava kaikki tarvittavat toimet merkkijonojen kanssa. Tätä varten sinun on löydettävä tarvittava elementti kustakin sarakkeesta ja lisättävä siihen vastaava arvo. Jokaisen kokoelman ulottuvuuden osalta sinun on tiedettävä yksilöllisten arvojen määrä ja näiden arvojen todellinen joukko.

Katsotaanpa nyt muotoa, jossa sarakkeiden sisällä olevat arvot on esitettävä - eli kuinka määritetään vaadittu rivi. Voit saavuttaa tämän useilla tavoilla. Yksinkertaisin olisi esittää jokainen sarake vektorina, mutta koska se on hyvin harva, muistia käytetään erittäin tehottomasti. Tämän välttämiseksi käytämme tietorakenteita, jotka parantavat tehokkuutta harvan yksiulotteisten taulukoiden (vektorien) esittämisessä. Yksinkertaisin niistä olisi tavallinen luettelo, yksittäin tai kaksinkertaisesti linkitettynä, mutta se on epätaloudellista elementtien käytön kannalta. Siksi käytämme puuta, joka tarjoaa nopeamman pääsyn elementteihin.

Voit esimerkiksi käyttää täsmälleen samaa puuta kuin sarakkeissa, mutta silloin sinun on luotava oma puu jokaiselle sarakkeelle, mikä johtaisi huomattavaan muistiin ja käsittelyaikaan. Tehdään se hieman ovelammin - luomme yhden puun tallentamaan kaikki merkkijonoissa käytetyt dimensioiden yhdistelmät, joka on identtinen yllä kuvatun kanssa, mutta sen elementit eivät ole osoittimia merkkijonoihin (joita ei sellaisenaan ole olemassa ), mutta niiden indeksit ja itse indeksien arvot eivät kiinnosta meitä ja niitä käytetään vain yksilöllisinä avaimina. Käytämme sitten näitä näppäimiä löytääksemme halutun elementin sarakkeesta. Itse sarakkeet esitetään helpoimmin tavallisena binääripuuna. Graafisesti tuloksena oleva rakenne voidaan esittää seuraavasti:

Kaavio 9. Kuva pivot-taulukosta binääripuuna

Voit käyttää pivot-taulukon sarakkeiden määrittämiseen samaa menettelyä kuin edellä kuvatulla tavalla ja määrittää sopivat rivinumerot. Tässä tapauksessa rivinumerot ovat yksilöllisiä yhdessä pivot-taulukossa ja tunnistavat elementtejä vektoreissa, jotka ovat pivot-taulukon sarakkeita. Suurin osa yksinkertainen vaihtoehto Nämä luvut luodaan ylläpitämällä laskuria ja lisäämällä sitä yhdellä, kun riviotsikkopuuhun lisätään uusi elementti. Itse nämä sarakevektorit tallennetaan helpoimmin binääripuiksi, joissa avaimena käytetään rivinumeron arvoa. Lisäksi on mahdollista käyttää hash-taulukoita. Koska näiden puiden kanssa työskentelymenetelmiä käsitellään yksityiskohtaisesti muissa lähteissä, emme viivyttele tässä ja tarkastelemme yleistä järjestelmää elementin lisäämiseksi sarakkeeseen.

Yleensä toimintosarja elementin lisäämiseksi matriisiin voidaan kuvata seuraavasti:

1. Määritä rivinumerot, joihin elementtejä lisätään

2.Määritä joukko sarakkeita, joihin lisätään elementtejä

3. Etsi kaikista sarakkeista elementit vaadituilla rivinumeroilla ja lisää niihin nykyinen elementti (lisääminen sisältää vaaditun määrän fakta-arvojen yhdistämisen ja aggregoitujen arvojen laskemisen, jotka voidaan määrittää asteittain).

Tämän algoritmin suorittamisen jälkeen saamme matriisin, joka on yhteenvetotaulukko, joka meidän piti rakentaa.

Nyt muutama sana suodatuksesta siivua rakennettaessa. Helpoin tapa tehdä tämä on matriisin rakennusvaiheessa, koska tässä vaiheessa on pääsy kaikkiin vaadittuihin kenttiin, ja lisäksi suoritetaan arvojen aggregointi. Tällöin välimuistista haettaessa merkintää tarkistetaan, ja jos se ei täyty, merkintä hylätään.

Koska edellä kuvattu rakenne kuvaa pivot-taulukon täysin, sen visualisointi on triviaali. Tässä tapauksessa voit käyttää tavallisia taulukkokomponentteja, jotka ovat saatavilla melkein kaikissa Windowsin ohjelmointityökaluissa.

Ensimmäinen OLAP-kyselyitä suorittava tuote oli Express (IRI). Itse termin OLAP keksi kuitenkin Edgar Codd, "relaatiotietokantojen isä". Ja Coddin työtä rahoitti Arbor, yritys, joka oli julkaissut oman OLAP-tuotteensa, Essbasen (myöhemmin osti Hyperion, jonka Oracle osti vuonna 2007) edellisenä vuonna. Muita tunnettuja OLAP-tuotteita ovat Microsoft Analysis Services (aiemmin OLAP Services, osa SQL Server), Oracle OLAP Option, IBM:n DB2 OLAP Server (itse asiassa EssBase IBM:n lisäyksellä), SAP BW, Brion, BusinessObjectsin, Cognosin, MicroStrategyn ja muiden valmistajien tuotteet.

Teknisestä näkökulmasta markkinoilla olevat tuotteet on jaettu "fyysiseen OLAPiin" ja "virtuaaliseen". Ensimmäisessä tapauksessa on olemassa ohjelma, joka suorittaa alustavan laskelman aggregaateista, jotka sitten tallennetaan erityiseen moniulotteiseen tietokantaan, joka tarjoaa nopean haun. Esimerkkejä tällaisista tuotteista ovat Microsoft Analysis Services, Oracle OLAP Option, Oracle/Hyperion EssBase, Cognos PowerPlay. Toisessa tapauksessa tiedot tallennetaan relaatiotietokantajärjestelmiin, ja aggregaatteja ei välttämättä ole ollenkaan tai ne voidaan luoda ensimmäisestä pyynnöstä DBMS- tai analyyttisen ohjelmiston välimuistiin. Esimerkkejä tällaisista tuotteista ovat SAP BW, BusinessObjects, Microstrategy. "Fyysiseen OLAPiin" perustuvat järjestelmät tarjoavat jatkuvasti paremmat vastausajat kyselyihin kuin "virtuaaliset OLAP"-järjestelmät. Virtual OLAP -toimittajat väittävät tuotteidensa parempaa skaalautuvuutta tukemaan erittäin suuria tietomääriä.

Tässä työssä haluaisin tarkastella lähemmin BaseGroup Labsin tuotetta - Deductor.

Deductor on analytiikkaalusta, ts. perusta kokonaisten sovellusratkaisujen luomiselle. Deductorissa toteutettujen teknologioiden avulla voit käydä läpi kaikki analyyttisen järjestelmän rakentamisen vaiheet yhden arkkitehtuurin pohjalta: tietovaraston luomisesta automaattiseen mallien valintaan ja saatujen tulosten visualisointiin.

Järjestelmän kokoonpano:

Deductor Studio on Deductor-alustan analyyttinen ydin. Deductor Studio sisältää täyden joukon mekanismeja, joiden avulla voit saada tietoa mielivaltaisesta tietolähteestä, suorittaa koko käsittelysyklin (puhdistus, tietojen muuntaminen, mallien rakentaminen), näyttää tulokset kätevimmällä tavalla (OLAP, taulukot, kaaviot , päätöspuut...) ja vientitulokset.

Deductor Viewer on loppukäyttäjän työasema. Ohjelman avulla voit minimoida henkilöstövaatimukset, koska kaikki tarvittavat toiminnot suoritetaan automaattisesti käyttämällä aiemmin valmisteltuja prosessointiskriptejä, ei tarvitse miettiä tiedon hankintamenetelmää ja sen käsittelymekanismeja. Dedustor Viewer -käyttäjän tarvitsee vain valita kiinnostava raportti.

Deductor Warehouse on moniulotteinen monialustainen tietovarasto, joka kerää kaiken aihealueen analysointiin tarvittavan tiedon. Yhden arkiston käyttö mahdollistaa kätevän pääsyn, suuri nopeus käsittely, tietojen johdonmukaisuus, keskitetty tallennus ja koko data-analyysiprosessin automaattinen tuki.

4. Asiakas-palvelin

Deductor Server on suunniteltu etäanalyyttiseen käsittelyyn. Se tarjoaa mahdollisuuden sekä automaattisesti "ajaa" tietoja palvelimella olevien komentosarjojen kautta ja kouluttaa uudelleen olemassa olevia malleja. Deductor Serverin avulla voit toteuttaa täysimittaisen kolmikerroksisen arkkitehtuurin, jossa se toimii sovelluspalvelimena. Pääsy palvelimeen tarjotaan käyttämällä Deductor Client -ohjelmaa.

Työn periaatteet:

1. Tuo tiedot

Kaikkien tietojen analysointi Deductorissa alkaa tietojen tuonnilla. Tuonnin tuloksena tiedot saatetaan myöhempää analysointia varten soveltuvaan muotoon käyttäen kaikkia ohjelmassa olevia mekanismeja. Tietojen luonteella, muodolla, DBMS:llä jne. ei ole väliä, koska kaikkien kanssa työskentelymekanismit ovat yhtenäiset.

2. Vie tiedot

Vientimekanismien avulla voit lähettää saadut tulokset kolmansien osapuolien sovelluksiin, esimerkiksi siirtää myyntiennusteen järjestelmään ostotilauksen luomiseksi tai valmistetun raportin lähettämisen yrityksen verkkosivustolle.

3. Tietojen käsittely

Prosessointi Deductorissa tarkoittaa mitä tahansa toimintoa, joka liittyy johonkin tiedon muuntamiseen, kuten suodatus, mallin rakentaminen, puhdistus jne. Itse asiassa tässä lohkossa suoritetaan analyysin kannalta tärkeimmät toimet. Deductorissa toteutettujen käsittelymekanismien merkittävin piirre on, että käsittelyn tuloksena saatua tietoa voidaan käsitellä uudelleen millä tahansa järjestelmän käytettävissä olevista menetelmistä. Siten voit rakentaa mielivaltaisen monimutkaisia ​​käsittelyskenaarioita.

4. Visualisointi

Voit visualisoida tietoja Deductor Studiossa (Viewer) missä tahansa käsittelyn vaiheessa. Järjestelmä määrittää itsenäisesti, miten se voi tehdä tämän, esimerkiksi jos neuroverkko on koulutettu, voit tarkastella taulukoiden ja kaavioiden lisäksi hermoverkkokaaviota. Käyttäjän on valittava luettelosta haluamasi vaihtoehto ja määritettävä useita parametreja.

5. Integrointimekanismit

Deductor ei tarjoa tiedonsyöttötyökaluja - alusta on keskittynyt yksinomaan analyyttiseen käsittelyyn. Heterogeenisiin järjestelmiin tallennetun tiedon käyttämiseksi tarjotaan joustavia tuonti-vientimekanismeja. Vuorovaikutus voidaan järjestää käyttämällä eräajoa, työskentelemällä OLE-palvelintilassa ja käyttämällä Deductor-palvelinta.

6. Tiedon replikointi

Deductorin avulla voit toteuttaa yhden minkä tahansa analyyttisen järjestelmän tärkeimmistä toiminnoista - tuen tiedon replikointiprosessille, ts. tarjoaa mahdollisuuden työntekijöille, jotka eivät ymmärrä analyysimenetelmiä ja menetelmiä tietyn tuloksen saamiseksi saada vastaus asiantuntijan laatimiin malleihin.

Zjohtopäätös

Tässä työssä tarkastelimme tällaista modernin aluetta tietotekniikat, kuten tietojen analysointijärjestelmät. Analyyttisen tiedonkäsittelyn päätyökalu - OLAP -tekniikka analysoidaan. OLAP-konseptin ydin ja OLAP-järjestelmien merkitys nykyaikaisessa liiketoimintaprosessissa paljastetaan yksityiskohtaisesti. ROLAP-palvelimen rakenne ja toimintaprosessi kuvataan yksityiskohtaisesti. Esimerkkinä OLAP-tietoteknologioiden toteutuksesta on Deductor-analyyttinen alusta. Toimitettu dokumentaatio on kehitetty ja täyttää vaatimukset.

OLAP-tekniikat ovat tehokas työkalu reaaliaikaiseen tietojenkäsittelyyn. OLAP-palvelimen avulla voit järjestää ja esittää tietoja eri analyysialueilta ja muuttaa tiedot arvokkaaksi tiedoksi, joka auttaa yrityksiä tekemään tietoisempia päätöksiä.

OLAP-järjestelmien käyttö tarjoaa jatkuvasti korkean suorituskyvyn ja skaalautuvuuden, mikä tukee usean gigatavun tietomääriä, joita tuhannet käyttäjät voivat käyttää. OLAP-tekniikoiden avulla tiedon saanti tapahtuu reaaliajassa, ts. Kyselyn käsittely ei enää hidasta analyysiprosessia, mikä varmistaa sen nopeuden ja tehokkuuden. Visuaalisten hallintatyökalujen avulla voit kehittää ja toteuttaa monimutkaisimpiakin analyyttisiä sovelluksia, mikä tekee prosessista yksinkertaisen ja nopean.

Samanlaisia ​​asiakirjoja

    OLAP-konseptin (On-Line Analytical Processing) perustana on tietojen operatiivinen analyyttinen käsittely, sen käytön ominaisuudet asiakkaalla ja palvelimella. OLAP-järjestelmien perusvaatimusten yleiset ominaisuudet sekä tiedon tallennustavat niihin.

    tiivistelmä, lisätty 12.10.2010

    OLAP: Yleiset luonteenpiirteet, tarkoitus, tavoitteet, tavoitteet. OLAP-tuotteiden luokittelu. OLAP-järjestelmän rakentamisen periaatteet, CubeBase-komponenttien kirjasto. Asiakkaan ja palvelimen OLAP-työkalujen suorituskyvyn riippuvuus tietomäärän kasvusta.

    kurssityö, lisätty 25.12.2013

    Ikuinen tietojen tallennus. OLAP-työkalun (On-line Analytical Processing) ydin ja merkitys. Tietokannat ja tietovarastot, niiden ominaisuudet. Rakenne, tallennusarkkitehtuuri, niiden toimittajat. Muutamia vinkkejä OLAP-kuutioiden suorituskyvyn parantamiseen.

    testi, lisätty 23.10.2010

    Tietojen analysointijärjestelmien rakentaminen. Algoritmien rakentaminen OLAP-kuution suunnitteluun ja kyselyjen luomiseen rakennetulle pivot-taulukolle. OLAP-tekniikka moniulotteiseen tiedon analysointiin. Tietojen tarjoaminen käyttäjille johtamispäätösten tekemistä varten.

    kurssityö, lisätty 19.9.2008

    Perustietoa OLAPista. Operatiivinen analyyttinen tietojenkäsittely. OLAP-tuotteiden luokittelu. Vaatimukset online-analyyttisille käsittelytyökaluille. Moniulotteisten tietokantojen käyttö operatiivisissa analyyttisissa käsittelyjärjestelmissä, niiden edut.

    kurssityö, lisätty 10.6.2011

    Verkkosivujen analysointialijärjestelmien kehittäminen käyttäen Microsoft Access ja Olap-teknologiat. Musiikkiportaalin tietojärjestelmän tietoanalyysialijärjestelmän kehittämisen teoreettiset näkökohdat. Olap-teknologiat tutkimusobjektin analysointialijärjestelmässä.

    kurssityö, lisätty 11.06.2009

    OLAP-työkalujen huomioiminen: julkisivujen ja tietovarastojen luokittelu, tietokuution käsite. Päätöksen tukijärjestelmän arkkitehtuuri. "Abitura"-järjestelmän ohjelmistototeutus. Verkkoraportin luominen Reporting Services -tekniikoilla.

    kurssityö, lisätty 12.5.2012

    Tiedon tallennus, organisointiperiaatteet. Prosessit tietojen kanssa työskentelyyn. OLAP-rakenne, moniulotteisen tiedon tallennuksen tekniset näkökohdat. Integraatiopalvelut, tietovarastojen ja datamarkettien täyttäminen. Microsoft-teknologioita käyttävien järjestelmien ominaisuudet.

    kurssityö, lisätty 12.5.2012

    Tietovarastokaavion rakentaminen kauppayritykselle. Tallennussuhdekaavioiden kuvaukset. Tuotetietojen näyttäminen. OLAP-kuution luominen tietojen lisäanalyysiä varten. Kyselyjen kehittäminen supermarketin tehokkuuden arvioimiseksi.

    testi, lisätty 19.12.2015

    Tietojen tallennuksen tarkoitus. SAP BW -arkkitehtuuri. Analyyttisen raportoinnin rakentaminen OLAP-kuutioihin SAP BW -järjestelmässä. Tärkeimmät erot tietovaraston ja OLTP-järjestelmän välillä. Yleiskatsaus BEx-toiminnallisista alueista. Kyselyn luominen BEx Query Designerissa.

Vuonna 1993 tietokannan rakentamisen relaatiolähestymistavan perustaja Edgar Codd ja hänen kumppaninsa (Edgar Codd, matemaatikko ja IBM-stipendiaatti) julkaisivat Arbor Softwaren (nykyään kuuluisa yritys Hyperion Solutions) aloitteesta artikkelin "Providing OLAP (" online-analyyttinen käsittely) analyyttisille käyttäjille", joka muotoili 12 OLAP-teknologian ominaisuutta, joita täydennettiin myöhemmin kuudella muulla. Näistä määräyksistä tuli uuden ja erittäin lupaavan tekniikan pääsisältö.

Tekniikan pääominaisuudet OLAP (perus):

  • datan moniulotteinen käsitteellinen esitys;
  • intuitiivinen tietojenkäsittely;
  • tietojen saatavuus ja yksityiskohdat;
  • erä tietojen poiminta tulkintaa vastaan;
  • OLAP-analyysimallit;
  • asiakas-palvelin-arkkitehtuuri (OLAP käytettävissä työpöydältä);
  • läpinäkyvyys (avoin pääsy ulkoisiin tietoihin);
  • monen käyttäjän tuki.

Lisäominaisuudet(erikois):

  • muotoilemattomien tietojen käsittely;
  • OLAP-tulosten tallentaminen: niiden tallentaminen erillään lähdetiedoista;
  • puuttuvien arvojen poissulkeminen;
  • Puuttuvien arvojen käsittely.

Raportoinnin ominaisuudet(Raportti):

  • joustavuus raportoinnissa;
  • standardinmukainen raportoinnin suorituskyky;
  • fyysisen tiedonpoimintakerroksen automaattinen konfigurointi.

Mittojen hallinta(Ulottuvuus):

  • mittausten yleisyys;
  • rajoittamaton määrä ulottuvuuksia ja aggregointitasoja;
  • rajaton määrä operaatioita ulottuvuuksien välillä.

Historiallisesti nykyään termi "OLAP" ei tarkoita vain moniulotteista näkymää loppukäyttäjän tiedoista, vaan myös moniulotteista näkymää kohdetietokannassa olevista tiedoista. Juuri tästä syystä itsenäisten termien ilmaantuminen liittyy toisiinsa "Relational OLAP"(ROLAP) ja "Moniulotteinen OLAP"(MOLAP).

OLAP-palvelu on työkalu suurten tietomäärien analysointiin reaaliajassa. Vuorovaikutuksessa OLAP-järjestelmän kanssa käyttäjä voi tarkastella tietoja joustavasti, hankkia mielivaltaisia ​​tietoviipaleita ja suorittaa analyyttisiä yksityiskohtia, konvoluutiota, päästä päähän -jakelua ja vertailua ajan kuluessa käyttämällä useita parametreja samanaikaisesti. Kaikki työ OLAP-järjestelmän kanssa tapahtuu aihepiirin mukaisesti ja mahdollistaa tilastollisesti järkevien mallien rakentamisen liiketoiminnan tilanteesta.

OLAP-ohjelmisto - on työkalu operatiivisen tiedon analysointiin sisältyvät arkistoon. Pääominaisuus on se, että näitä työkaluja ei saa käyttää tietotekniikan asiantuntija, ei tilastotieteilijä, vaan sovelletun johtamisen alan ammattilainen - osaston, osaston, johdon johtaja ja lopuksi ohjaaja. Työkalut on suunniteltu analyytikkoviestintään ongelman kanssa, ei tietokoneen kanssa. Kuvassa Kuva 6.14 näyttää perus-OLAP-kuution, jonka avulla voit arvioida tietoja kolmessa ulottuvuudessa.

Moniulotteinen OLAP-kuutio ja vastaavien matemaattisten algoritmien järjestelmä tilastolliseen käsittelyyn mahdollistavat minkä tahansa monimutkaisuuden datan analysoinnin milloin tahansa.


Riisi. 6.14.

Koska johtajalla on käytettävissään joustavat mekanismit tietojen käsittelyä ja visuaalista näyttöä varten (Kuva 6.15, Kuva 6.16), johtaja tutkii ensin dataa eri näkökulmista, jotka voivat (tai eivät) liittyä ratkaistavaan ongelmaan.

Seuraavaksi hän vertailee erilaisia ​​liiketoiminnan indikaattoreita keskenään yrittäen tunnistaa piilotettuja suhteita; voi tarkastella tietoja tarkemmin, yksityiskohtaisesti, esimerkiksi jakamalla sen osiin ajan, alueen tai asiakkaan mukaan, tai päinvastoin yleistää edelleen tiedon esitystapaa häiritsevien yksityiskohtien poistamiseksi. Sen jälkeen moduulin avulla tilastollinen arviointi ja simulointimallinnus Tapahtumien kehittämiseen rakennetaan useita vaihtoehtoja, joista valitaan hyväksyttävin vaihtoehto.


Riisi. 6.15.

Esimerkiksi yritysjohtajalla voi olla hypoteesi, että omaisuuden kasvun leviäminen yrityksen eri toimialoilla riippuu teknis-taloudellisen koulutuksen omaavien asiantuntijoiden suhteesta. Tämän hypoteesin testaamiseksi johtaja voi pyytää varastosta ja näyttää kaaviossa niiden sivukonttoreiden korkosuhteen, joiden omaisuuden kasvu kuluvalla vuosineljänneksellä laski yli 10 % viime vuoteen verrattuna, ja niille, jotka kasvoivat yli 25 %. Hänen pitäisi pystyä käyttämään yksinkertaista valintaa tarjotusta valikosta. Jos saadut tulokset jakautuvat merkittävästi kahteen vastaavaan ryhmään, tämän pitäisi toimia kannustimena esitetyn hypoteesin testaamiseen edelleen.

Tällä hetkellä suunta ns dynaaminen mallinnus(Dynamic Simulation), joka toteuttaa täysin yllä olevan FASMI-periaatteen.

Dynaamisen mallinnuksen avulla analyytikko rakentaa mallin liiketoimintatilanteesta, joka kehittyy ajan myötä tietyn skenaarion mukaan. Lisäksi tällaisen mallintamisen tuloksena voi olla useita uusia liiketoimintatilanteita, jotka muodostavat mahdollisten ratkaisujen puun, jossa arvioidaan kunkin todennäköisyys ja tulevaisuudennäkymät.


Riisi. 6.16.

Taulukossa 6.3 on esitetty staattisen ja dynaamisen analyysin vertailuominaisuudet.

Taulukko 6.3.
Ominaista Staattinen analyysi Dynaaminen analyysi
Kysymysten tyypit WHO? Mitä? Kuinka monta? Miten? Kun? Missä? Miksi niin? Mitä tapahtuisi jos...? Mitä tapahtuu jos…?
Vasteaika Ei säännelty Sekuntia
Tyypillisiä dataoperaatioita Säännelty raportti, kaavio, taulukko, piirustus Interaktiivisten raporttien, kaavioiden, näyttölomakkeiden järjestys. Dynaamisesti muuttuvat koontitasot ja datalohkot
Analyyttisten vaatimusten taso Keskiverto Korkea
Näytön muotojen tyyppi Pohjimmiltaan ennalta määrätty, säännelty Käyttäjän määrittelemä, muokattavissa
Tietojen yhdistämistaso Yksityiskohtainen ja yhteenveto Käyttäjän määrittelemä
Tietojen "ikä". Historiallista ja nykyistä Historiallista, nykyistä ja ennakoitua
Pyyntötyypit Enimmäkseen ennakoitavissa Ennalta arvaamaton - tapauskohtaisesti
Tarkoitus Säännelty analyyttinen käsittely Monivaiheanalyysi, mallintaminen ja ennustaminen

Lähes aina tehtävänä on rakentaa analyyttinen järjestelmä moniulotteista data-analyysiä varten. yhtenäinen, koordinoitu tietojärjestelmä, joka perustuu heterogeeniseen ohjelmisto ja ratkaisut. Ja itse keinojen valinnasta IP:n toteuttamiseksi tulee erittäin vaikea tehtävä. Tässä on otettava huomioon monet tekijät, mukaan lukien erilaisten keskinäinen yhteensopivuus ohjelmistokomponentit, niiden kehittämisen, käytön ja integroinnin helppous, toiminnan tehokkuus, vakaus ja tasaiset muodot, eri valmistusyritysten välisten suhteiden taso ja mahdolliset näkymät.

OLAP on käytettävissä aina, kun on tehtävä monimuuttujatietojen analysointi. Yleisesti ottaen, jos sinulla on tietotaulukko, jossa on vähintään yksi kuvaava sarake ja yksi sarake numeroilla, OLAP-työkalu on tehokas työkalu raporttien analysointiin ja luomiseen. Esimerkkinä OLAP-tekniikan käytöstä kannattaa harkita tutkimusta myyntiprosessin tuloksista.

Keskeiset kysymykset: "Paljonko myytiin?", "Millä määrällä myytiin?" laajenee, kun liiketoiminta muuttuu monimutkaisemmaksi ja historialliset tiedot kerääntyvät tiettyihin tekijöihin tai osiin: "..Pietarissa, Moskovassa, Uralissa, Siperiassa...", ".. viimeisellä neljänneksellä verrattuna nykyinen", " ..toimittajalta A verrattuna toimittajaan B..." jne.

Vastaukset tällaisiin kysymyksiin ovat tarpeen johdon päätösten tekemiseksi: valikoiman muuttaminen, hinnat, myymälöiden, sivukonttoreiden sulkeminen ja avaaminen, sopimusten irtisanominen ja allekirjoittaminen jälleenmyyjien kanssa, mainoskampanjoiden toteuttaminen tai lopettaminen jne.

Jos yrität korostaa päälukuja (faktoja) ja osioita (mittausargumentteja), joita analyytikko manipuloi yrittäessään laajentaa tai optimoida yrityksen liiketoimintaa, saat myyntianalyysiin sopivan taulukon eräänlaisena mallina, joka vaatii asianmukaisia ​​säätöjä jokaista yritystä.

Aika. Yleensä nämä ovat useita ajanjaksoja: vuosi, vuosineljännes, kuukausi, vuosikymmen, viikko, päivä. Monet OLAP-työkalut laskevat automaattisesti korkeimmat jaksot päivämäärästä ja laskevat niille kokonaissummat.

Tuotekategoria. Luokkia voi olla useita, ne vaihtelevat jokaisessa liiketoiminnassa: Lajike, Malli, Pakkaustyyppi jne. Jos myydään vain yksi tuote tai valikoima on hyvin pieni, luokkaa ei tarvita.

Tuote. Joskus käytetään tuotteen (tai palvelun) nimeä, sen koodia tai tuotenumeroa. Tapauksissa, joissa valikoima on erittäin suuri (ja joillain yrityksillä on hinnastossaan kymmeniä tuhansia nimikkeitä), kaikkien tavaroiden alkuanalyysiä ei välttämättä tehdä, vaan se yleistetään joihinkin sovittuihin luokkiin.

Alue. Yrityksen maailmanlaajuisuudesta riippuen voit tarkoittaa maanosaa, maaryhmää, maata, aluetta, kaupunkia, aluetta, katua, osaa kadusta. Tietenkin, jos ulostuloa on vain yksi, tämä ulottuvuus puuttuu.

Myyntimies. Tämä mittaus riippuu myös yrityksen rakenteesta ja laajuudesta. Tämä voi olla: sivuliike, kauppa, jälleenmyyjä, myyntipäällikkö. Joissain tapauksissa mittausta ei ole, esimerkiksi kun myyjä ei vaikuta myyntimääriin, on vain yksi kauppa ja niin edelleen.

Ostaja. Joissakin tapauksissa, kuten vähittäiskaupassa, ostaja on persoonaton eikä mittausta ole, toisissa tapauksissa ostajaa koskevat tiedot ovat saatavilla ja ovat tärkeitä myynnin kannalta. Tämä ulottuvuus voi sisältää ostoyrityksen nimen tai useita asiakasryhmiä ja -ominaisuuksia: Toimiala, Yritysryhmä, Omistaja jne. Myynnin rakenteen analyysi tärkeimpien komponenttien tunnistamiseksi kiinnostuksen kohteena olevassa kontekstissa. Tätä varten on kätevää käyttää esimerkiksi "Pie" -tyyppistä kaaviota monimutkaisissa tapauksissa, kun tarkastellaan 3 ulottuvuutta kerralla - "Sarakkeet". Esimerkiksi Computer Equipment -liikkeessä vuosineljänneksen aikana tietokoneiden myynti oli 100 000 dollaria, valokuvauslaitteiden - 10 000 dollaria ja kulutustarvikkeiden - 4 500 dollaria. Johtopäätös: myymälän liikevaihto riippuu suurelta osin tietokoneiden myynnistä (itse asiassa ehkä kuluvia tarvikkeita tarvitaan tietokoneiden myymiseen, mutta tämä on analyysi sisäisistä riippuvuuksista).

Dynaaminen analyysi ( taantumisanalyysi- trendien tunnistaminen). Trendien ja kausivaihteluiden tunnistaminen. Dynamiikka näkyy selvästi "Line"-tyyppisellä kaaviolla. Esimerkiksi Intel-tuotteiden myynti laski vuoden aikana, kun taas Microsoftin myynti kasvoi. Ehkä keskivertoasiakkaan hyvinvointi on parantunut tai liikkeen imago ja sen mukana asiakaskoostumus on muuttunut. Valikoima on mukautettava. Toinen esimerkki: 3 vuoden ajan videokameroiden myynti laskee talvella.

Riippuvuusanalyysi(korrelaatioanalyysi). Eri tuotteiden myyntimäärien vertailu ajan kuluessa tarvittavan valikoiman tunnistamiseksi - "kori". Tähän tarkoitukseen on myös kätevää käyttää "Line" -kaaviota. Esimerkiksi kun tulostimet poistettiin valikoimasta kahden ensimmäisen kuukauden aikana, jauhekasettien myynnin havaittiin laskevan.

4. OLAP-tuotteiden luokittelu.

5. OLAP-asiakkaiden toimintaperiaatteet.

7. OLAP-tekniikoiden käyttöalueet.

8. Esimerkki OLAP-tekniikoiden käytöstä myynnin analysoinnissa.

1. OLAPin paikka yrityksen tietorakenteessa.

Termi "OLAP" liittyy erottamattomasti termiin "tietovarasto" (Data Warehouse).

Varaston tiedot tulevat operatiivisista järjestelmistä (OLTP-järjestelmät), jotka on suunniteltu automatisoimaan liiketoimintaprosesseja. Lisäksi arkistoa voidaan täydentää ulkoisista lähteistä, kuten tilastoraporteista.

Arkiston tarkoituksena on tarjota "raaka-aine" analysointiin yhdessä paikassa ja yksinkertaisessa, ymmärrettävässä rakenteessa.

On vielä yksi syy, joka oikeuttaa erillisen tietovaraston luomisen - monimutkaiset analyyttiset kyselyt operatiiviseen tietoon hidastuvat tämänhetkinen työ yrityksiä, estämällä pöytiä pitkään ja kaappaamalla palvelinresursseja.

Arkisto ei välttämättä tarkoita valtavaa tiedon kerääntymistä - pääasia, että se on kätevä analysoitavaksi.

Keskittäminen ja kätevä jäsentäminen eivät ole kaikkea, mitä analyytikko tarvitsee. Hän tarvitsee edelleen työkalun tiedon katseluun ja visualisointiin. Perinteisistä raporteista, jopa yhteen tietovarastoon rakennetuista, puuttuu yksi asia - joustavuus. Niitä ei voi "vääntää", "laajentaa" tai "kutistaa" halutun näkymän saamiseksi tiedoista. Kunpa hänellä olisi työkalu, jonka avulla hän voisi laajentaa ja tiivistää tietoja yksinkertaisesti ja kätevästi! OLAP toimii tällaisena työkaluna.

Vaikka OLAP ei ole tietovaraston välttämätön attribuutti, sitä käytetään yhä enemmän varastoon kertyneen tiedon analysointiin.

OLAPin paikka yrityksen tietorakenteessa (kuva 1).

Kuva 1. PaikkaOLAP yrityksen tietorakenteessa

Toimintatiedot kerätään eri lähteistä, puhdistetaan, integroidaan ja tallennetaan relaatiosäilöön. Lisäksi ne ovat jo nyt analysoitavissa erilaisilla raportointityökaluilla. Sitten tiedot (kokonaan tai osittain) valmistetaan OLAP-analyysiä varten. Ne voidaan ladata erityiseen OLAP-tietokantaan tai tallentaa relaatiomuistiin. Sen tärkein elementti on metadata eli tieto tiedon rakenteesta, sijoittelusta ja muuntamisesta. Niiden ansiosta eri tallennuskomponenttien tehokas vuorovaikutus varmistetaan.

Yhteenvetona voidaan todeta, että voimme määritellä OLAPin työkalusarjaksi varastoon kertyneen tiedon moniulotteiseen analysointiin.

2. Operatiivinen analyyttinen tietojenkäsittely.

OLAP-konsepti perustuu moniulotteisen tiedon esityksen periaatteeseen. Vuonna 1993 E. F. Codd käsitteli relaatiomallin puutteita ja korosti ensisijaisesti kyvyttömyyttä "yhdistää, tarkastella ja analysoida tietoja useissa ulottuvuuksissa, eli yritysanalyytikoille ymmärrettävimmällä tavalla" ja määritteli yleiset vaatimukset. OLAP-järjestelmille, jotka laajentavat relaatiotietokantajärjestelmän toimintoja ja sisältävät moniulotteisen analyysin yhdeksi sen ominaisuuksista.

Coddin mukaan moniulotteinen käsitteellinen näkymä on moniulotteinen perspektiivi, joka koostuu useista itsenäisistä ulottuvuuksista, joita pitkin voidaan analysoida tiettyjä tietojoukkoja.

Useiden ulottuvuuksien samanaikainen analyysi määritellään monimuuttujaanalyysiksi. Jokainen ulottuvuus sisältää datan konsolidoinnin alueita, jotka koostuvat sarjasta peräkkäisiä yleistystasoja, joissa jokainen korkeampi taso vastaa suurempaa datan aggregointiastetta vastaavalle ulottuvuudelle.

Siten Performer-ulottuvuus voidaan määrittää konsolidoinnin suunnalla, joka koostuu yleistystasoista "yritys - osasto - osasto - työntekijä". Aika-ulottuvuus voi sisältää jopa kaksi konsolidointisuuntaa - "vuosi - vuosineljännes - kuukausi - päivä" ja "viikko - päivä", koska ajan laskeminen kuukausittain ja viikoittain ei ole yhteensopivia. Tässä tapauksessa on mahdollista valita mielivaltaisesti haluttu tietotaso kullekin ulottuvuudelle.

Laskeutumisoperaatio (poraaminen) vastaa siirtymistä ylemmistä konsolidoinnin vaiheista alemmille; päinvastoin, nostotoiminto (rullaa ylös) tarkoittaa liikettä alemmalta tasolta korkeammalle (kuva 2).


Kuva 2.Tietojen yhdistämisen mitat ja suunnat

3. Online-analyyttisten käsittelytyökalujen vaatimukset.

Moniulotteinen lähestymistapa syntyi lähes samanaikaisesti ja rinnakkain relaatioperiaatteen kanssa. Kuitenkin vasta 1990-luvun puolivälistä, tai pikemminkin alkaen
1993, kiinnostus MDBMS alkoi yleistyä. Tänä vuonna ilmestyi uusi ohjelmallinen artikkeli yhdeltä relaatiolähestymistavan perustajista E. Codda, jossa hän muotoili 12 perusvaatimusta toteutusvälineille OLAP(Pöytä 1).

Pöytä 1.

Moniulotteinen tiedon esitys

Työkalujen on tuettava käsitteellisesti moniulotteista näkymää tiedoista.

Läpinäkyvyys

Käyttäjän ei tarvitse tietää, mitä työkaluja datan tallentamiseen ja käsittelyyn käytetään, miten tiedot on järjestetty ja mistä se tulee.

Saatavuus

Työkalujen itsensä on valittava paras tietolähde ja otettava yhteyttä siihen, jotta he voivat vastata tiettyyn pyyntöön. Työkalujen tulee pystyä kartoittaa automaattisesti oma logiikkansa erilaisiin heterogeenisiin tietolähteisiin.

Tasainen suorituskyky

Suorituskyvyn tulisi olla käytännössä riippumaton kyselyn ulottuvuuksien määrästä.

Asiakas-palvelin-arkkitehtuurin tuki

Työkalujen tulee toimia asiakas-palvelin-arkkitehtuurissa.

Kaikkien ulottuvuuksien tasa-arvo

Mikään mitoista ei saa olla perusmitta, vaan niiden kaikkien tulee olla yhtä suuria (symmetrisiä).

Harvaiden matriisien dynaaminen käsittely

Määrittämättömät arvot tulee tallentaa ja käsitellä mahdollisimman tehokkaalla tavalla.

Tuki usean käyttäjän tilaan tietojen kanssa työskentelyyn

Työkalujen tulee tarjota mahdollisuus useammalle kuin yhdelle käyttäjälle.

Tukipohjainen toiminta erilaisia ​​mittoja

Kaikkia moniulotteisia operaatioita (kuten yhdistämistä) on sovellettava yhtenäisesti ja johdonmukaisesti mihin tahansa ulottuvuuteen.

Tietojen käsittelyn helppous

Työkaluissa tulee olla kätevin, luonnollisin ja mukavin käyttöliittymä.

Kehittyneet tietojen esitystyökalut

Työkalujen on tuettava erilaisia ​​tapoja visualisoida (esittää) dataa.

Rajoittamaton määrä datan kokoamisen ulottuvuuksia ja tasoja

Tuettujen ulottuvuuksien määrää ei pitäisi rajoittaa.

Säännöt OLAP-luokan ohjelmistotuotteiden arvioimiseksi

Näitä vaatimuksia, jotka toimivat varsinaisena OLAP-määritelmänä, tulisi pitää ohjeena, ja yksittäisiä tuotteita tulisi arvioida sen mukaan, missä määrin ne täyttävät täydellisesti kaikki vaatimukset.

Coddin määritelmä muutettiin myöhemmin ns. FASMI-testiksi, joka edellyttää, että OLAP-sovellus tarjoaa mahdollisuuden analysoida nopeasti jaettua moniulotteista tietoa.

Coddin 12 säännön muistaminen on liian raskasta useimmille ihmisille. Kävi ilmi, että voimme tiivistää OLAP-määritelmän vain viidellä avainsanoja: Jaetun moniulotteisen tiedon nopea analyysi - tai lyhyesti - FASMI (käännetty englannista:F ast A analyysi S jänistetty M ultraulotteinen minä tiedot).

Tämä määritelmä muotoiltiin ensimmäisen kerran vuoden 1995 alussa, eikä sitä ole sen jälkeen tarvittu tarkistaa.

NOPEA ( nopea) - tarkoittaa, että järjestelmän pitäisi pystyä antamaan useimmat vastaukset käyttäjille noin viiden sekunnin sisällä. Samaan aikaan yksinkertaisimmat pyynnöt käsitellään yhdessä sekunnissa ja hyvin harvat - yli 20 sekunnissa. Tutkimus on osoittanut, että loppukäyttäjät pitävät prosessia epäonnistuneena, jos tuloksia ei saada 30 sekunnin kuluttua.

Ensi silmäyksellä saattaa tuntua yllättävältä, että vastaanotettaessa raporttia minuutissa, joka ei niin kauan sitten kesti päiviä, käyttäjä kyllästyy odottaessaan hyvin nopeasti ja projekti osoittautuu paljon vähemmän onnistuneeksi kuin hetkessä. jopa vähemmän yksityiskohtaisen analyysin kustannuksella.

ANALYYSItarkoittaa, että järjestelmä pystyy selviytymään minkä tahansa loogisen ja tilastollisen analyysin kanssa Tämä hakemus ja varmistaa sen säilymisen loppukäyttäjän saatavilla olevassa muodossa.

Ei ole niin tärkeää, tehdäänkö tämä analyysi talon sisällä työkaluja ah myyjä tai siihen liittyvä ulkoinen ohjelmistotuote, kuten laskentataulukko, kaikki tarvittavat analyysitoiminnot on tarjottava intuitiivisella tavalla loppukäyttäjille. Analyysityökalut voivat sisältää tiettyjä menettelyjä, kuten aikasarja-analyysin, kustannusten allokoinnin, valuutansiirrot, kohdehaut, moniulotteisten rakenteiden muuttamisen, ei-proseduurien mallinnuksen, poikkeuksien havaitsemisen, tiedon poiminnan ja muut sovelluksesta riippuvat toiminnot. Tällaiset ominaisuudet vaihtelevat suuresti eri tuotteiden kohdesuuntauksesta riippuen.

JAETTU tarkoittaa, että järjestelmä toteuttaa kaikki yksityisyyden suojausvaatimukset (mahdollisesti solutasolle asti) ja, jos tarvitaan useita kirjoitusoikeuksia, varmistaa, että muutokset estetään sopivalla tasolla. Kaikki sovellukset eivät vaadi tietojen palautusta. Tällaisten sovellusten määrä on kuitenkin kasvussa, ja järjestelmän on kyettävä käsittelemään useita muutoksia oikea-aikaisesti ja turvallisesti.

MONIULOTTEINEN (Moniulotteinen) - tämä on keskeinen vaatimus. Jos sinun pitäisi määritellä OLAP yhdellä sanalla, valitsisit sen. Järjestelmän on tarjottava moniulotteinen käsitteellinen näkymä tiedoista, mukaan lukien täysi tuki hierarkioihin ja useisiin hierarkioihin, koska tämä on selvästi loogisin tapa analysoida yrityksiä ja organisaatioita. Käsiteltävien dimensioiden vähimmäismäärää ei ole, koska se riippuu myös sovelluksesta, ja useimmilla OLAP-tuotteilla on riittävä määrä mittoja kohdemarkkinoilleen.

TIEDOT - tässä kaikki. Tarvittavat tiedot on hankittava sieltä, missä sitä tarvitaan. Paljon riippuu kuitenkin sovelluksesta. Eri tuotteiden teho mitataan sillä, kuinka paljon syöttödataa ne pystyvät käsittelemään, mutta ei sillä, kuinka monta gigatavua ne voivat tallentaa. Tuotteiden teho vaihtelee suuresti – suurimmat OLAP-tuotteet pystyvät käsittelemään vähintään tuhat kertaa enemmän dataa kuin pienimmät. Tässä suhteessa on otettava huomioon monia tekijöitä, mukaan lukien tietojen kopiointi, RAM-vaatimukset, levytilan käyttö, suorituskykymittarit, integrointi tietovarastojen kanssa jne.

FASMI-testi on järkevä ja ymmärrettävä määritelmä tavoitteista, joihin OLAP pyrkii.

4. LuokitteluOLAP-Tuotteet.

Joten, OLAPin ydin perustuu siihen, että analyysin alkutiedot esitetään moniulotteisena kuutiona, ja sitä on mahdollista mielivaltaisesti manipuloida ja saada tarvittavat tietoosiot - raportit. Tässä tapauksessa loppukäyttäjä näkee kuution moniulotteisena dynaamisena taulukkona, joka automaattisesti tiivistää tiedot (faktat) eri osioihin (ulottuvuuksiin) ja mahdollistaa laskelmien ja raporttien interaktiivisen hallinnan. Näiden toimien toteuttaminen varmistetaan OLAP -auto (tai auto OLAP-laskelmat).

Nykyään maailmassa on kehitetty monia tuotteita, jotka myyvät OLAP -teknologiat. Niiden välillä navigoinnin helpottamiseksi käytetään luokituksia OLAP -tuotteet: tietojen tallennusmenetelmällä analysointia varten ja sijainnin mukaan OLAP -autot. Katsotaanpa tarkemmin jokaista luokkaa OLAP tuotteet.

Luokittelu tietojen tallennustavan mukaan

Moniulotteiset kuutiot rakennetaan lähde- ja aggregaattitietojen perusteella. Kuutioiden lähde- ja aggregaattitiedot voidaan tallentaa sekä relaatio- että moniulotteisiin tietokantoihin. Siksi tällä hetkellä käytetään kolmea tietojen tallennusmenetelmää: MOLAP (moniulotteinen OLAP), ROLAP (relaatio OLAP) ja HOLAP (hybridi OLAP) ). Vastaavasti, OLAP -tuotteet tietojen tallennustavan mukaan jaetaan kolmeen samanlaiseen luokkaan:

1. MOLAPin tapauksessa , lähde- ja aggregaattitiedot tallennetaan moniulotteiseen tietokantaan tai moniulotteiseen paikalliseen kuutioon.

2. ROLAPissa -tuotteiden lähdetiedot tallennetaan relaatiotietokantoihin tai tasaisiin paikallisiin taulukoihin tiedostopalvelimella. Aggregoidut tiedot voidaan sijoittaa palvelutaulukoihin samassa tietokannassa. Tietojen muuntaminen relaatiotietokannasta moniulotteisiksi kuutioiksi tapahtuu pyynnöstä OLAP-työkalut.

3. Käytön tapauksessa HOLAP arkkitehtuuri, alkuperäinen data jää relaatiotietokantaan ja aggregaatit sijoitetaan moniulotteiseen tietokantaan. Rakentaminen OLAP -kuutio toteutetaan pyynnöstä OLAP - relaatio- ja moniulotteiseen dataan perustuvat työkalut.

Luokittelu sijainnin mukaan OLAP-autot.

Tällä pohjalla OLAP -tuotteet on jaettu OLAP-palvelimet ja OLAP-asiakkaat:

· Palvelimessa OLAP - Aggregaattitietojen laskenta- ja tallennusvälineet suorittaa erillinen prosessi - palvelin. Asiakassovellus vastaanottaa vain palvelimelle tallennettujen moniulotteisten kuutioiden kyselyjen tulokset. Jonkin verran OLAP -palvelimet tukevat tietojen tallennusta vain relaatiotietokantoihin, jotkut vain moniulotteisiin tietokantoihin. Monet modernit OLAP -palvelimet tukevat kaikkia kolmea tiedon tallennustapaa:MOLAP, ROLAP ja HOLAP.

MOLAP.

MOLAP on Moniulotteinen online-analyyttinen käsittely, eli moniulotteinen OLAP.Tämä tarkoittaa, että palvelin käyttää moniulotteista tietokantaa (MDB) tietojen tallentamiseen. MBD:n käytön tarkoitus on ilmeinen. Se voi tallentaa tehokkaasti luonteeltaan moniulotteisia tietoja, mikä mahdollistaa tietokantakyselyjen nopean palvelun. Tiedot siirretään tietolähteestä moniulotteiseen tietokantaan, jonka jälkeen tietokanta kootaan yhteen. Esilaskenta nopeuttaa OLAP-kyselyitä, koska yhteenvetotiedot on jo laskettu. Kyselyajasta tulee vain sen ajan funktio, joka tarvitaan yksittäisen datan käyttämiseen ja laskennan suorittamiseen. Tämä menetelmä tukee ajatusta, että työ tehdään kerran ja tuloksia käytetään sitten uudestaan ​​ja uudestaan. Moniulotteiset tietokannat ovat suhteellisen uusi tekniikka. MBD:n käytöllä on samat haitat kuin useimmilla uusilla teknologioilla. Ne eivät nimittäin ole yhtä vakaita kuin relaatiotietokannat (RDB:t), eikä niitä ole optimoitu samassa määrin. Toinen MDB:n heikkous on kyvyttömyys käyttää useimpia moniulotteisia tietokantoja tietojen yhdistämisprosessissa, joten uuden tiedon saaminen analysoitavaksi kestää jonkin aikaa.

ROLAP.

ROLAP on Relationaalinen online-analyyttinen käsittely, eli relaatio-OLAP.Termi ROLAP tarkoittaa, että OLAP-palvelin perustuu relaatiotietokantaan. Lähdetiedot syötetään relaatiotietokantaan, tyypillisesti tähti- tai lumihiutalekaaviona, mikä auttaa lyhentämään hakuaikaa. Palvelin tarjoaa moniulotteisen tietomallin käyttämällä optimoituja SQL-kyselyjä.

On useita syitä valita relaatiotietokanta moniulotteisen tietokannan sijaan. RDB on vakiintunut tekniikka, jossa on monia optimointimahdollisuuksia. Tosimaailman käyttö johti hienostuneeseen tuotteeseen. Lisäksi RDB:t tukevat suurempia tietomääriä kuin MDB:t. Ne on suunniteltu juuri sellaisiin määriin. Pääargumentti RDB:tä vastaan ​​on kyselyiden monimutkaisuus, joita tarvitaan tiedon saamiseksi suuresta tietokannasta SQL:n avulla. Kokematon SQL-ohjelmoija voi helposti kuormittaa arvokkaita järjestelmäresursseja yrittämällä suorittaa jonkin samanlaisen kyselyn, joka on paljon helpompi suorittaa MDB:ssä.

Kootut/esikootut tiedot.

Nopea kyselyn käyttöönotto on välttämätöntä OLAP:lle. Tämä on yksi OLAPin perusperiaatteista - kyky käsitellä tietoja intuitiivisesti edellyttää nopeaa tiedonhakua. Yleisesti ottaen mitä enemmän laskelmia on tehtävä tiedon saamiseksi, sitä hitaampi on vastaus. Siksi, jotta kyselyn toteutusaika pysyisi lyhyenä, yleensä useimmin saavutettavat, mutta myös laskemista vaativat tiedot kootaan alustavasti. Toisin sanoen ne lasketaan ja tallennetaan sitten tietokantaan uutena tietona. Esimerkki etukäteen laskettavissa olevista tiedoista on yhteenvetotiedot - esimerkiksi kuukausien, vuosineljänneksien tai vuosien myyntiluvut, joille syötettävät tosiasialliset tiedot ovat päivälukuja.

Eri toimittajilla on erilaiset menetelmät parametrien valintaan, jotka vaativat esikoontamisen ja ennalta laskettujen arvojen lukumäärän. Aggregointitapa vaikuttaa sekä tietokantaan että kyselyn suoritusaikaan. Jos lasketaan useampia arvoja, todennäköisyys, että käyttäjä pyytää jo laskettua arvoa, kasvaa, ja siksi vasteaika lyhenee, kun alkuperäistä arvoa ei tarvitse pyytää laskemaan. Jos kuitenkin lasket kaikki mahdolliset arvot - tämä ei ole paras ratkaisu - tässä tapauksessa tietokannan koko kasvaa merkittävästi, mikä tekee siitä hallitsemattoman ja yhdistämisaika on liian pitkä. Lisäksi kun numeerisia arvoja lisätään tietokantaan tai jos ne muuttuvat, tämän tiedon on heijastuttava ennalta lasketuissa arvoissa, jotka riippuvat uudesta tiedosta. Näin ollen tietokannan päivitys voi kestää myös kauan, jos esilaskettuja arvoja on paljon. Koska tietokanta toimii tyypillisesti offline-tilassa aggregoinnin aikana, on toivottavaa, että yhdistämisaika ei ole liian pitkä.

OLAP - Asiakas rakentuu eri tavalla. Moniulotteisen kuution rakentaminen ja OLAP -laskutoimitukset suoritetaan asiakastietokoneen muistissa.OLAP -asiakkaat jaetaan myös ROLAP ja MOLAP.Ja jotkut saattavat tukea molempia tietojen käyttövaihtoehtoja.

Jokaisella näistä lähestymistavoista on omat hyvät ja huonot puolensa. Vastoin yleistä käsitystä palvelintyökalujen eduista asiakastyökaluihin verrattuna, useissa tapauksissa käytetään OLAP - Asiakas voi olla tehokkaampi ja käyttäjien kannalta kannattavampi käyttää OLAP-palvelimet.

Analyyttisten sovellusten kehittäminen asiakas-OLAP-työkaluilla on nopea prosessi eikä vaadi erityiskoulutusta. Tietokannan fyysisen toteutuksen tunteva käyttäjä voi kehittää analyyttisen sovelluksen itsenäisesti ilman IT-asiantuntijaa.

Kun käytät OLAP-palvelinta, sinun on opittava käyttämään kahta eri järjestelmää, joskus eri toimittajilta - luomaan kuutioita palvelimelle ja kehittämään asiakassovellusta.

OLAP-asiakas tarjoaa yhden visuaalisen käyttöliittymän kuutioiden kuvaamiseen ja käyttöliittymien määrittämiseen niille.

Joten missä tapauksissa OLAP-asiakkaan käyttö voi olla käyttäjille tehokkaampaa ja kannattavampaa kuin OLAP-palvelimen käyttö?

· Sovelluksen taloudellinen toteutettavuus OLAP -palvelin tapahtuu, kun tietomäärät ovat erittäin suuria ja ylivoimaisia OLAP -asiakas, muuten jälkimmäisen käyttö on perusteltua. Tässä tapauksessa OLAP -Asiakas yhdistää korkeat suorituskykyominaisuudet ja alhaiset kustannukset.

· Tehokkaat PC:t analyytikoille – toinen argumentti puolesta OLAP - asiakkaat. Käytettäessä OLAP -palvelimet eivät käytä tätä kapasiteettia.

OLAP-asiakkaiden etuja ovat seuraavat:

· Käyttöönotto- ja ylläpitokustannukset OLAP - asiakkaan kustannukset ovat huomattavasti alhaisemmat OLAP-palvelin.

· Käyttämällä OLAP - Asiakkaalle, jossa on sisäänrakennettu kone, tiedonsiirto verkon yli suoritetaan kerran. Tekemällä OLAP - uusien tietovirtojen operaatioita ei synny.

5. Toimintaperiaatteet OLAP- asiakkaat.

Katsotaanpa OLAP-sovelluksen luomisprosessia asiakastyökalulla (kuva 1).

Kuva 1.OLAP-sovelluksen luominen ROLAP-asiakastyökalulla

ROLAP-asiakkaiden toimintaperiaate on semanttisen kerroksen alustava kuvaus, jonka taakse lähdetiedon fyysinen rakenne on piilotettu. Tässä tapauksessa tietolähteitä voivat olla: paikalliset taulukot, RDBMS. Tuettujen tietolähteiden luettelo määräytyy tietyn ohjelmistotuotteen mukaan. Tämän jälkeen käyttäjä voi itsenäisesti käsitellä aihealueensa suhteen ymmärtämiään objekteja kuutioiden ja analyyttisten rajapintojen luomiseksi.

OLAP-palvelinasiakkaan toimintaperiaate on erilainen. OLAP-palvelimessa käyttäjä manipuloi tietokannan fyysisiä kuvauksia luodessaan kuutioita. Samanaikaisesti itse kuutioon luodaan mukautettuja kuvauksia. OLAP-palvelinasiakas on määritetty vain kuutiolle.

Semanttista kerrosta luotaessa tietolähteet - Myynti- ja Deal-taulukot - kuvataan termeillä, jotka loppukäyttäjä voi ymmärtää ja muuttaa "tuotteiksi" ja "tarjouksiksi". "Tuotteet"-taulukon "ID"-kenttä nimetään uudelleen nimellä "Koodi" ja "Nimi" nimellä "Tuote" jne.

Sitten luodaan Myynti-liiketoimintaobjekti. Liikeobjekti on tasainen pöytä, jonka pohjalta muodostetaan moniulotteinen kuutio. Liiketoimintaobjektia luotaessa Tuotteet- ja Tapahtumat-taulukot yhdistetään tuotteen Koodi-kenttään. Koska kaikkia taulukon kenttiä ei vaadita näytettäväksi raportissa, liiketoimintaobjekti käyttää vain "Tuote", "Päivämäärä" ja "Summa" -kenttiä.

Esimerkissämme "Myynti"-liiketoimintaobjektin perusteella luotiin raportti tuotemyynnistä kuukausittain.

Vuorovaikutteisen raportin parissa työskennellessään käyttäjä voi asettaa suodatus- ja ryhmittelyehdot samoilla yksinkertaisilla hiiren liikkeillä. Tässä vaiheessa ROLAP-asiakas käyttää välimuistissa olevia tietoja. OLAP-palvelinasiakasohjelma luo uuden kyselyn moniulotteiseen tietokantaan. Esimerkiksi käyttämällä myyntiraportissa tuotekohtaista suodatinta saat raportin meitä kiinnostavien tuotteiden myynnistä.

Kaikki OLAP-sovellusasetukset voidaan tallentaa erityiseen metatietosäilöön, sovellukseen tai moniulotteiseen tietokantajärjestelmän arkistoon.Käyttöönotto riippuu tietystä ohjelmistotuotteesta.

Kaikki, mitä näihin sovelluksiin sisältyy, on tavallinen katsaus käyttöliittymään, ennalta määritettyihin toimintoihin ja rakenteeseen sekä nopeita ratkaisuja enemmän tai vähemmän standarditilanteisiin. Esimerkiksi rahoituspaketit ovat suosittuja. Valmiiksi rakennetut taloussovellukset antavat ammattilaisille mahdollisuuden käyttää tuttuja taloustyökaluja ilman, että heidän tarvitsee suunnitella tietokantarakennetta tai perinteisiä lomakkeita ja raportteja.

Internet on uusi asiakasmuoto. Lisäksi siinä on uuden teknologian leima; joukko Internet-ratkaisut eroavat merkittävästi ominaisuuksiltaan yleensä ja erityisesti OLAP-ratkaisuna. OLAP-raporttien luomisessa Internetissä on monia etuja. Merkittävin on erikoisohjelmistojen tarve tiedon saamiseksi. Tämä säästää yritykseltä paljon aikaa ja rahaa.

6. OLAP-sovellusarkkitehtuurin valitseminen.

Tieto- ja analyyttistä järjestelmää toteutettaessa on tärkeää, että OLAP-sovelluksen arkkitehtuuria valittaessa ei tehdä virhettä. On-Line Analytical Process -termin kirjaimellinen käännös - "online-analyyttinen käsittely" - on usein otettu kirjaimellisesti siinä mielessä, että järjestelmään saapuvat tiedot analysoidaan nopeasti. Tämä on väärinkäsitys - analyysin tehokkuudella ei ole mitään tekemistä sen kanssa reaaliaika järjestelmän tietojen päivittäminen. Tämä ominaisuus viittaa OLAP-järjestelmän vasteaikaan käyttäjän pyyntöihin. Samalla analysoidut tiedot edustavat usein tilannekuvaa tiedosta "eilisestä", jos esimerkiksi varastojen tiedot päivitetään kerran päivässä.

Tässä yhteydessä OLAPin käännös "interaktiiviseksi analyyttiseksi käsittelyksi" on tarkempi. Se on kyky analysoida tietoja interaktiivisessa tilassa, joka erottaa OLAP-järjestelmät säänneltyjen raporttien valmistelujärjestelmistä.

Toinen vuorovaikutteisen prosessoinnin ominaisuus OLAPin perustajan E. Coddin muotoilussa on kyky "yhdistää, tarkastella ja analysoida dataa useiden ulottuvuuksien näkökulmasta, eli yritysanalyytikoille ymmärrettävimmällä tavalla". Codd itse käyttää termiä OLAP viittaamaan yksinomaan tiettyyn tapaan esittää dataa käsitteellisellä tasolla - moniulotteisesti. Fyysisellä tasolla tietoja voidaan tallentaa relaatiotietokantoihin, mutta todellisuudessa OLAP-työkalut toimivat tyypillisesti moniulotteisten tietokantojen kanssa, joissa tiedot on järjestetty hyperkuutioon (Kuva 1).

Kuva 1. OLAP- kuutio (hyperkuutio, metakuutio)

Lisäksi näiden tietojen relevanssi määräytyy sen mukaan, milloin hyperkuutio täyttyy uudella tiedolla.

Ilmeisesti moniulotteisen tietokannan luomiseen kuluva aika riippuu merkittävästi siihen ladatun datan määrästä, joten tätä määrää on järkevää rajoittaa. Mutta kuinka voidaan välttää analyysimahdollisuuksien kaventaminen ja sen, että käyttäjä ei pääse käyttämään kaikkea kiinnostavaa tietoa? Vaihtoehtoisia polkuja on kaksi: Analysoi sitten kysely ja Kysely ja analysoi.

Ensimmäisen polun kannattajat ehdottavat yleisten tietojen lataamista moniulotteiseen tietokantaan, esimerkiksi kuukausittaiset, neljännesvuosittaiset ja vuosittaiset osastojen tulokset. Ja jos tietoja on tarpeen tarkentaa, käyttäjää pyydetään luomaan raportti käyttämällä relaatiotietokantaa, joka sisältää vaaditun valinnan, esimerkiksi päiväkohtaisesti tietylle osastolle tai kuukausittain ja valitun osaston työntekijöiden mukaan.

Toisen polun kannattajat päinvastoin ehdottavat, että käyttäjä ensin päättäisi datasta, jota hän aikoo analysoida, ja lataa ne mikrokuutioon - pieneen moniulotteiseen tietokantaan. Molemmat lähestymistavat eroavat käsitteellisellä tasolla ja niillä on omat etunsa ja haittansa.

Toisen lähestymistavan etuja ovat sen tiedon "tuoreus", jonka käyttäjä saa moniulotteisen raportin - "mikrokuution" - muodossa. Mikrokuutio muodostetaan nykyisestä relaatiotietokannasta juuri pyydettyjen tietojen perusteella. Mikrokuution kanssa työskentely tapahtuu interaktiivisessa tilassa - tiedon siivujen saaminen ja sen yksityistäminen mikrokuution sisällä tapahtuu välittömästi. Toinen myönteinen asia on, että mikrokuution rakenteen ja täytön suunnittelun tekee käyttäjä lennossa ilman tietokannan ylläpitäjän osallistumista. Lähestymistapa kärsii kuitenkin myös vakavista puutteista. Käyttäjä ei näe kokonaiskuvaa, ja hänen on päätettävä etukäteen tutkimuksensa suunta. Muussa tapauksessa pyydetty mikrokuutio voi olla liian pieni eikä sisällä kaikkia kiinnostavia tietoja, ja käyttäjän on pyydettävä uusi mikrokuutio, sitten uusi, sitten toinen ja toinen. Kyselyanalyysimenetelmä toteuttaa samannimisen yrityksen BusinessObjects-työkalun ja yrityksen Contour-alustan työkalut.Intersoft Lab.

Analysoi ja kysely -lähestymistavalla moniulotteiseen tietokantaan ladattavan tiedon määrä voi olla varsin suuri, täyttö on tehtävä määräysten mukaisesti ja voi viedä melko paljon aikaa. Kaikki nämä haitat kuitenkin maksavat itsensä takaisin myöhemmin, kun käyttäjällä on pääsy lähes kaikkiin tarvittaviin tietoihin missä tahansa yhdistelmässä. Relaatiotietokannan lähdetietoihin pääsee käsiksi vain viimeisenä keinona, kun tarvitaan tarkempia tietoja esimerkiksi tietystä laskusta.

Yksittäisen moniulotteisen tietokannan toimintaan ei käytännössä vaikuta sitä käyttävien käyttäjien määrä. He lukevat vain siellä olevan tiedon, toisin kuin Query then -analyysi -lähestymistapa, jossa mikrokuutioiden määrä voi ääritapauksessa kasvaa samaa tahtia kuin käyttäjien määrä.

Tämä lähestymistapa lisää IT-palvelujen kuormitusta, jotka relaatiopalvelujen lisäksi joutuvat ylläpitämään myös moniulotteisia tietokantoja.Nämä palvelut ovat vastuussa ajoissa automaattinen päivitys tiedot moniulotteisissa tietokannoissa.

Analysoi ja kysely -lähestymistavan merkittävimmät edustajat ovat Cognosin PowerPlay- ja Impromptu-työkalut.

Sekä lähestymistavan että sen toteuttavan työkalun valinta riippuu ensisijaisesti tavoiteltavasta tavoitteesta: aina pitää tasapainottaa budjettisäästöjen ja loppukäyttäjien palvelun laadun parantamisen välillä. On otettava huomioon, että strategisessa suunnitelmassa tieto- ja analyyttisten järjestelmien luomisella pyritään kilpailuedun saavuttamiseen, eikä vältymään automatisoinnin kustannuksilta. Esimerkiksi yritystieto- ja analyyttinen järjestelmä voi tarjota yrityksestä tarpeellista, oikea-aikaista ja luotettavaa tietoa, jonka julkaiseminen mahdollisille sijoittajille varmistaa yrityksen läpinäkyvyyden ja ennustettavuuden, mikä tulee väistämättä edellytykseksi sen sijoitus houkuttelevuudelle.

7. OLAP-tekniikoiden käyttöalueet.

OLAP on käytettävissä aina, kun on tehtävä monimuuttujatietojen analysointi. Yleensä ottaen huomioon tietotaulukon, jossa on vähintään yksi kuvaava sarake (ulottuvuus) ja yksi numeerinen sarake (mitat tai tosiasiat), OLAP-työkalu on yleensä tehokas analyysi- ja raportointityökalu.

Katsotaanpa joitain OLAP-tekniikoiden sovellusalueita tosielämästä.

1. Myynti.

Myynnin rakenteen analyysin perusteella ratkaistaan ​​johtamispäätösten tekemiseen tarvittavat asiat: tavaravalikoiman, hintojen muuttaminen, myymälöiden, konttoreiden sulkeminen ja avaaminen, sopimusten irtisanominen ja allekirjoittaminen jälleenmyyjien kanssa, mainoskampanjoiden toteuttaminen tai lopettaminen jne.

2. Hankinta.

Tehtävä on myyntianalyysin vastakohta. Monet yritykset ostavat komponentteja ja materiaaleja toimittajilta. Kauppayritykset ostavat tavaroita jälleenmyyntiä varten. Hankintojen analysoinnissa on monia mahdollisia tehtäviä suunnittelusta lähtien Raha aikaisemman kokemuksen perusteella, jopa valvoa esimiehiä, valitessasi toimittajia.

3. Hinnat.

Markkinahintojen analysointi liittyy läheisesti ostojen analysointiin. Tämän analyysin tarkoituksena on optimoida kustannukset ja valita kannattavimmat tarjoukset.

4. Markkinointi.

Markkinointianalyysillä tarkoitamme vain palvelun ostajien tai asiakkaiden-kuluttajien analyysialuetta. Tämän analyysin tarkoituksena on tuotteen oikea asemointi, kohdennetun mainonnan ostajaryhmien tunnistaminen ja valikoiman optimointi. OLAPin tehtävänä tässä tapauksessa on antaa käyttäjälle työkalu, jonka avulla hän saa nopeasti, ajatuksen nopeudella vastauksia kysymyksiin, jotka intuitiivisesti heräävät data-analyysin aikana.

5. Varasto.

Varastosaldeiden rakenteen analysointi tavaratyypeittäin, varastot, tavaroiden säilyvyyden analysointi, lähetysten analysointi vastaanottajan mukaan ja monet muut yritykselle tärkeät analyysit ovat mahdollisia, jos organisaatiolla on varastokirjanpito.

6. Kassavirta.

Tämä on koko analyysialue, jolla on monia koulukuntia ja menetelmiä. OLAP-tekniikka voi toimia työkaluna näiden tekniikoiden toteuttamiseen tai parantamiseen, mutta ei korvaa niitä. Muiden kuin käteisvarojen ja käteisvarojen kassakiertoa analysoidaan liiketoiminnan, vastapuolien, valuuttojen ja ajan suhteen, jotta voidaan optimoida virrat, varmistaa likviditeetti jne. Mittausten koostumus riippuu voimakkaasti liiketoiminnan, toimialan ja metodologian ominaisuuksista.

7. Budjetti.

Yksi OLAP-tekniikoiden hedelmällisimmistä sovellusalueista. Ei ole turhaa, että mitään nykyaikaista budjetointijärjestelmää ei pidetä täydellisenä ilman OLAP-työkaluja budjettianalyysiin. Useimmat budjettiraportit rakennetaan helposti OLAP-järjestelmien pohjalta. Samalla raportit vastaavat hyvin monenlaisiin kysymyksiin: kulujen ja tuottojen rakenteen analysointia, eri toimialojen tiettyjen erien kulujen vertailua, tiettyjen erien kulujen dynamiikan ja trendien analysointia, kustannusanalyysiä ja voitot.

8. Tilit.

Klassinen tilinumerosta koostuva tase, joka sisältää saapuvat saldot, liikevaihdot ja lähtevät saldot, voidaan analysoida täydellisesti OLAP-järjestelmässä. Lisäksi OLAP-järjestelmä voi automaattisesti ja erittäin nopeasti laskea monitoimialaorganisaation konsolidoidut saldot, kuukauden, vuosineljänneksen ja vuoden saldot, tilihierarkian aggregoidut saldot sekä analyyttisiin ominaisuuksiin perustuvat analyyttiset saldot.

9. Taloudellinen raportointi.

Teknisesti rakennettu raportointijärjestelmä ei ole muuta kuin joukko nimettyjä indikaattoreita, joissa on päivämääräarvot, jotka on ryhmiteltävä ja tiivistettävä eri osiin erityisten raporttien saamiseksi. Tällöin raporttien näyttäminen ja tulostaminen on helpoimmin ja edullisimmin toteutettu OLAP-järjestelmissä. Joka tapauksessa yrityksen sisäinen raportointijärjestelmä ei ole niin konservatiivinen, ja sen rakennetta voidaan muuttaa rahan säästämiseksi. insinöörityöt raporttien luomiseen ja moniulotteisten operatiivisten analyysiominaisuuksien hankkimiseen.

10. Sivuston liikenne.

Internet-palvelimen lokitiedosto on luonteeltaan moniulotteinen, joten se soveltuu OLAP-analyysiin. Faktat ovat: käyntien määrä, osumien määrä, sivulla vietetty aika ja muut lokissa olevat tiedot.

11. Tuotantomäärät.

Tämä on toinen esimerkki tilastollisesta analyysistä. Siten on mahdollista analysoida viljeltyjen perunoiden, terässulatettujen ja tuotettujen tavaroiden määriä.

12. Kulutustarvikkeiden kulutus.

Kuvittele tehdas, joka koostuu kymmenistä työpajoista, joissa kulutetaan jäähdytysnesteitä, huuhtelunesteitä, öljyjä, riepuja, hiekkapaperia – satoja erityyppisiä kulutusosia. Tarkkaa suunnittelua ja kustannusten optimointia varten tarvitaan perusteellinen analyysi kulutustarvikkeiden todellisesta kulutuksesta.

13. Tilojen käyttö.

Toinen tilastollisen analyysin tyyppi. Esimerkkejä: luokkahuoneiden työmäärän analysointi, vuokrarakennukset ja -tilat, kokoustilojen käyttö jne.

14. Henkilöstön vaihtuvuus yrityksessä.

Yrityksen henkilöstön vaihtuvuuden analyysi toimialojen, osastojen, ammattien, koulutustason, sukupuolen, iän, ajan mukaan.

15. Matkustajakuljetukset.

Analyysi myytyjen lippujen määrästä ja summista sesongin, suunnan, kuljetustyypin (luokan), junatyypin (lentokone) mukaan.

Tämä luettelo ei rajoitu käyttöalueisiin OLAP - teknologiat. Harkitse esimerkiksi tekniikkaa OLAP - Analyysi myynnin alalla.

8. Käyttöesimerkki OLAP - myynnin alan analysointiteknologiat.

Moniulotteisen dataesityksen suunnittelu OLAP -analyysi alkaa mittauskartan muodostamisella. Esimerkiksi myyntiä analysoitaessa voi olla suositeltavaa tunnistaa yksittäiset markkinoiden osat (kehittyvät, vakaat, suuret ja pienet kuluttajat, uusien kuluttajien todennäköisyys jne.) ja arvioida myyntimääriä tuotteen, alueen, asiakkaan, markkinasegmentin mukaan. , myyntikanava ja tilauskoot. Nämä suunnat muodostavat myynnin moniulotteisen esityksen koordinaattiruudukon - sen ulottuvuuksien rakenteen.

Koska minkä tahansa yrityksen toiminta tapahtuu ajan kuluessa, ensimmäinen kysymys, joka analyysissä herää, on kysymys liiketoiminnan kehityksen dynamiikasta. Aika-akselin oikea järjestäminen antaa meille mahdollisuuden vastata laadullisesti tähän kysymykseen. Tyypillisesti aika-akseli on jaettu vuosiin, neljänneksiin ja kuukausiin. Vielä suurempi pirstoutuminen viikoiksi ja päiviksi on mahdollista. Aikaulottuvuuden rakenne muodostetaan ottaen huomioon tiedon vastaanottotiheys; voidaan myös määrittää tiedon kysynnän tiheys.

Tuoteryhmä-ulottuvuus on suunniteltu kuvastamaan mahdollisimman tarkasti myytävien tuotteiden rakennetta. Samanaikaisesti on tärkeää säilyttää tietty tasapaino, jotta toisaalta vältetään liiallinen yksityiskohta (ryhmien lukumäärän tulee olla näkyvissä) ja toisaalta, jotta et menetä merkittävää markkinasegmenttiä.

"Asiakkaat"-ulottuvuus heijastaa myynnin rakennetta alueellisesti ja maantieteellisesti. Jokaisella ulottuvuudella voi olla omat hierarkiansa, esimerkiksi tässä ulottuvuudessa se voi olla rakenne: Maat – Alueet – Kaupungit – Asiakkaat.

Jos haluat analysoida osastojen suorituskykyä, sinun tulee luoda oma mittaus. Voimme esimerkiksi erottaa kaksi hierarkian tasoa: osastot ja niihin sisältyvät divisioonat, minkä pitäisi näkyä "Divisioonat"-dimensiossa.

Itse asiassa mitat "Aika", "Tuotteet", "Asiakkaat" määrittelevät täysin aihealueen tilan.

Lisäksi on hyödyllistä jakaa tämä tila ehdollisiksi alueiksi laskettujen ominaisuuksien perusteella, esimerkiksi transaktiovolyymien vaihteluvälit arvossa. Sitten koko liiketoiminta voidaan jakaa useisiin kustannusluokkiin, joissa sitä harjoitetaan. Tässä esimerkissä voimme rajoittua seuraaviin indikaattoreihin: tavaroiden myynnin määrä, myytyjen tavaroiden määrä, tulojen määrä, tapahtumien määrä, asiakkaiden lukumäärä, valmistajien ostojen määrä.

OLAP - analyysikuutio näyttää tältä (kuva 2):


Kuva 2.OLAP– kuutio myyntimäärien analysointiin

Juuri tätä kolmiulotteista taulukkoa kutsutaan kuutioksi OLAP-termeissä. Itse asiassa tiukan matematiikan näkökulmasta tällainen taulukko ei aina ole kuutio: todellisessa kuutiossa on oltava sama määrä elementtejä kaikissa ulottuvuuksissa, mutta OLAP-kuutioilla ei ole tällaista rajoitusta. OLAP-kuution ei tarvitse olla kolmiulotteinen. Se voi olla sekä kaksi- että moniulotteinen ratkaistavan ongelman mukaan. Vakavat OLAP-tuotteet on suunniteltu noin 20:lle ulottuvuudelle.. Yksinkertaisemmat työpöytäsovellukset tukevat noin kuutta ulottuvuutta.

Kuution kaikkia elementtejä ei tarvitse täyttää: jos tuotteen 2 myynnistä asiakkaalle 3 kolmannella vuosineljänneksellä ei ole tietoa, vastaavan solun arvoa ei yksinkertaisesti määritetä.

Kuutio itsessään ei kuitenkaan sovellu analysointiin. Jos on vielä mahdollista kuvitella tai kuvata kolmiulotteinen kuutio, niin kuusi- tai yhdeksäntoista-ulotteinen tilanne on paljon pahempi. Siksi tavalliset kaksiulotteiset taulukot poimitaan ennen käyttöä moniulotteisesta kuutiosta. Tätä toimintoa kutsutaan kuution "leikkaukseksi". Analyytikko ikään kuin ottaa ja "leikkaa" kuution mitat häntä kiinnostavien merkkien mukaan. Tällä tavalla analyytikko vastaanottaa kaksiulotteisen siivun kuutiosta (raportista) ja työskentelee sen kanssa. Raportin rakenne on esitetty kuvassa 3.

Kuva 3.Analyyttisen raportin rakenne

Leikataan OLAP-kuutio ja hankitaan myyntiraportti kolmannelta vuosineljännekseltä, se näyttää tältä (kuva 4).

Kuva 4.Kolmannen vuosineljänneksen myyntiraportti

Voit leikata kuution toista akselia pitkin ja saada raportin tuoteryhmän 2 myynnistä vuoden aikana (kuva 5).

Kuva 5.Tuotteen 2 neljännesvuosittainen myyntiraportti

Vastaavasti voit analysoida suhdetta asiakkaan 4, leikkaa kuutio Clients-merkin mukaan(Kuva 6)

Kuva 6.Raportti tavaroiden toimituksista asiakkaalle 4

Voit tarkentaa raportin kuukausittain tai puhua tavaroiden toimittamisesta tietylle asiakkaan haaralle.

Raportin tarkoitus

Tämä raportti keskittyy yhteen älykkäiden teknologioiden luokista, jotka ovat kätevä analyyttinen työkalu - OLAP-teknologiat.

Raportin tarkoitus: paljastaa ja korostaa 2 asiaa: 1) OLAPin käsite ja niiden soveltaminen taloushallinnossa; 2) OLAP-toiminnallisuuden käyttöönotto ohjelmistoratkaisuja: erot, mahdollisuudet, edut, haitat.

Haluan heti huomauttaa, että OLAP on universaali työkalu, jota voidaan käyttää kaikilla sovellusalueilla, eikä vain rahoituksessa (kuten raportin otsikosta voi ymmärtää), joka vaatii datan analysointia eri menetelmillä.

Varainhoito

Taloushallinto on alue, jolla analysointi on tärkeämpää kuin millään muulla. Kaikki taloudelliset ja hallintopäätökset syntyvät tiettyjen analyyttisten menettelyjen seurauksena. Nykyään taloushallinnosta on tulossa tärkeä merkitys yrityksen menestyksekkäälle toiminnalle. Huolimatta siitä, että taloushallinto on apuprosessi yrityksessä, se vaatii erityistä huomiota, koska virheelliset talous- ja johtamispäätökset voivat johtaa suuriin tappioihin.

Taloushallinnon tavoitteena on tarjota yritykselle tarvittavat määrät, oikeaan aikaan ja oikeassa paikassa taloudellisia resursseja, jotta niiden käytöstä saadaan maksimaalinen vaikutus optimaalisen jakelun kautta.

"Resurssitehokkuuden maksimitehokkuuden" tasoa on ehkä vaikea määritellä, mutta joka tapauksessa

Talousjohtajan tulee aina tietää:

  • Kuinka paljon taloudellisia resursseja on käytettävissä?
  • Mistä varat tulevat ja missä määrin?
  • mihin sijoittaa tehokkaammin ja miksi?
  • ja milloin tämä kaikki on tehtävä?
  • kuinka paljon tarvitaan yrityksen normaalin toiminnan varmistamiseksi?

Näihin kysymyksiin järkevien vastausten saamiseksi tarvitaan, analysoida ja osata analysoida riittävän suuri määrä suorituskykyindikaattoreita. Lisäksi FU kattaa valtavan määrän alueita: kassavirta-analyysi (kassavirta), varojen ja velkojen analyysi, kannattavuusanalyysi, marginaalianalyysi, kannattavuusanalyysi, lajitelma-analyysi.

Tietoa

Siksi avaintekijä taloushallinnon prosessin tehokkuudessa on tiedon saatavuus:

  • Aihealueen henkilökohtainen tietämys (voisi sanoa teoreettinen ja metodologinen), mukaan lukien kokemus, rahoittajan/talousjohtajan intuitio
  • Yleinen (yritys)tieto tai systemaattinen tieto yrityksen rahoitustapahtumien tosiseikoista (eli tiedot yrityksen menneestä, nykyisestä ja tulevasta tilasta, esitetty erilaisina indikaattoreina ja mittareina)

Jos ensimmäinen kuuluu tämän rahoittajan (tai tämän työntekijän palkkaaneen HR-johtajan) toiminta-alueeseen, toinen tulisi tarkoituksellisesti luoda yrityksessä talous- ja tietopalvelujen työntekijöiden yhteisillä ponnisteluilla.

Mitä siellä nyt on

Nyt yrityksissä on kuitenkin tyypillinen paradoksaalinen tilanne: tietoa on, sitä on paljon, liikaa. Mutta se on kaoottisessa tilassa: jäsentämätön, epäjohdonmukainen, hajanainen, ei aina luotettava ja usein virheellinen, sitä on melkein mahdotonta löytää ja saada. Suoritetaan pitkä ja usein hyödytön tilinpäätösvuorten sukupolvi, mikä on hankalaa taloudellisen analyysin kannalta ja vaikeasti ymmärrettävää, koska se ei ole luotu sisäistä hallintoa varten, vaan toimitettavaksi ulkoisille sääntelyviranomaisille.

Yrityksen tekemän tutkimuksen tulosten mukaan Reuters 1 300 kansainvälisestä johtajasta 38 % vastaajista sanoo, että he viettävät paljon aikaa etsiessään tarvitsemaansa tietoa. Osoittautuu, että korkeasti koulutettu asiantuntija ei käytä korkeasti palkattua aikaa tietojen analysointiin, vaan tähän analyysiin tarvittavien tietojen keräämiseen, etsimiseen ja systematisointiin. Samalla esimiehet ovat ylikuormitettuja usein epäolennaisella tiedolla, mikä taas heikentää heidän työnsä tehokkuutta. Syy tähän tilanteeseen: ylimääräinen tieto ja tiedon puute.

Mitä tehdä

Tieto on muutettava tiedoksi. Nykyaikaiselle liiketoiminnalle arvokas tieto, sen systemaattinen hankinta, synteesi, vaihto, käyttö on eräänlainen valuutta, mutta sen vastaanottamiseksi on välttämätöntä hallita tietoa, kuten mikä tahansa liiketoimintaprosessi.

Tiedonhallinnan avain on oikean tiedon toimittaminen oikeassa muodossa organisaation sidosryhmille oikeaan aikaan. Tällaisen johtamisen tavoitteena on auttaa ihmisiä työskentelemään paremmin yhdessä käyttämällä yhä suurempia tietomääriä.

Tietotekniikka toimii tässä tapauksessa keinona, jolla yrityksen tietoja voitaisiin systematisoida, tarjota tietyille käyttäjille pääsy siihen ja antaa heille työkalut muuttaa tämä tieto tiedoksi.

OLAP-tekniikoiden peruskäsitteet

OLAP-tekniikat (englanninkielisestä On-Line Analytical Processingista) ei ole tietyn tuotteen nimi, vaan koko teknologia varastoon kertyneen moniulotteisen tiedon operatiiviseen analysointiin. Ymmärtääksemme OLAPin olemuksen, on tarpeen tarkastella perinteistä tiedonhankintaprosessia päätöksentekoa varten.

Perinteinen päätöksentekojärjestelmä

Tässä voi tietysti olla myös monia vaihtoehtoja: täydellinen tietokaaos tai tyypillisin tilanne, kun yrityksessä on toimintajärjestelmiä, joiden avulla tiettyjen toimintojen tosiasiat tallennetaan ja tallennetaan tietokantoihin. Tietojen poimimiseksi tietokannoista analyyttisiä tarkoituksia varten on rakennettu tiettyjen tietonäytteiden kyselyjärjestelmä.

Mutta tästä päätöksenteon tukimenetelmästä puuttuu joustavuus ja sillä on monia haittoja:

  • Käytetään mitätön määrä tietoa, josta voi olla hyötyä päätöksenteossa
  • joskus luodaan monimutkaisia ​​monisivuisia raportteja, joista 1-2 riviä on todella käytetty (loput ovat vain varmuuden vuoksi) - tiedon ylikuormitus
  • prosessin hidas reagointi muutoksiin: jos tarvitaan uusi dataesitys, ohjelmoijan on kuvattava ja koodattava pyyntö muodollisesti ja vasta sitten suoritettava. Odotusaika: tuntia, päivää. Tai ehkä ratkaisua tarvitaan nyt, välittömästi. Mutta uuden tiedon saatuaan herää uusi kysymys (selventävä)

Jos kyselyraportit esitetään yksiulotteisessa muodossa, niin liiketoiminnan ongelmat ovat yleensä moniulotteisia ja monitahoisia. Jos haluat saada selkeän kuvan yrityksen liiketoiminnasta, sinun on analysoitava tietoja eri näkökulmista.

Monet yritykset luovat erinomaisia ​​relaatiotietokantoja, jotka mieluiten järjestävät vuoria käyttämätöntä tietoa, mikä ei sinänsä tarjoa nopeaa tai riittävän asiantuntevaa vastausta markkinoiden tapahtumiin. KYLLÄ - relaatiotietokannat olivat, ovat ja tulevat olemaan sopivin tekniikka yritystietojen tallentamiseen. Emme puhu uudesta tietokantateknologiasta, vaan pikemminkin analyysityökaluista, jotka täydentävät olemassa olevien DBMS-järjestelmien toimintoja ja ovat riittävän joustavia tarjoamaan ja automatisoimaan OLAP:iin sisältyviä erityyppisiä älyllisiä analyysejä.

OLAPin ymmärtäminen

Mitä OLAP tarjoaa?

  • Kehittyneet tallennustietojen käyttötyökalut
  • Dynaaminen interaktiivinen tietojen käsittely (kierto, yhdistäminen tai poraus)
  • Selkeä visuaalinen tietojen näyttö
  • Nopea – analyysi suoritetaan reaaliajassa
  • Moniulotteinen tietojen esittäminen - useiden indikaattoreiden samanaikainen analyysi useiden ulottuvuuksien mukaan

Saadaksesi vaikutuksen OLAP-tekniikoiden käytöstä, sinun on: 1) ymmärrettävä itse teknologioiden ydin ja niiden ominaisuudet; 2) määritellä selkeästi, mitä prosesseja on analysoitava, millä indikaattoreilla niitä luonnehditaan ja missä ulottuvuuksissa ne on suositeltavaa nähdä, eli luoda analyysimalli.

OLAP-tekniikoiden peruskäsitteet ovat seuraavat:

Moniulotteisuus

Tietojen moniulotteisuuden ymmärtämiseksi sinun tulee ensin esittää taulukko, jossa näkyy esimerkiksi yrityskustannusten kehitys taloudellisten elementtien ja liiketoimintayksiköiden mukaan.

Nämä tiedot esitetään kahdessa ulottuvuudessa:

  • artikla
  • liiketoimintayksikkö

Tämä taulukko ei ole informatiivinen, sillä se näyttää myynnin tietyltä ajanjaksolta. Eri ajanjaksoilla analyytikot joutuvat vertailemaan useita taulukoita (jokaiselle ajanjaksolle):

Kuvassa näkyy kolmas ulottuvuus, aika, kahden ensimmäisen lisäksi. (Artikkeli, liiketoimintayksikkö)

Toinen tapa näyttää moniulotteinen data on esittää se kuution muodossa:

OLAP-kuutioiden avulla analyytikot voivat saada tietoja eri osista saadakseen vastauksia yrityksen esittämiin kysymyksiin:

  • Mitkä kustannukset ovat kriittisiä missä liiketoimintayksiköissä?
  • Miten liiketoimintayksikkökustannukset muuttuvat ajan myötä?
  • Miten kustannuserät muuttuvat ajan myötä?

Vastaukset tällaisiin kysymyksiin ovat välttämättömiä johtamispäätösten tekemiseksi: tiettyjen kustannuserien vähentämisestä, vaikutuksista niiden rakenteeseen, kustannusten ajan mittaan muutosten syiden tunnistamiseen, suunnitelmasta poikkeamiin ja niiden poistamiseen - rakenteen optimointiin.

Tässä esimerkissä otetaan huomioon vain 3 ulottuvuutta. On vaikea kuvata enemmän kuin 3 ulottuvuutta, mutta se toimii samalla tavalla kuin 3 ulottuvuutta.

Tyypillisesti OLAP-sovellukset antavat sinun hankkia tietoja kolmesta tai useammasta ulottuvuudesta, esimerkiksi voit lisätä vielä yhden ulottuvuuden - Suunnitelma-Toteuma, Kustannusluokka: suora, epäsuora, tilausten mukaan, kuukausien mukaan. Lisämittojen avulla voit saada enemmän analyyttisiä osia ja antaa vastauksia kysymyksiin useilla ehdoilla.

Hierarkia

OLAPin avulla analyytikot voivat myös järjestää kunkin ulottuvuuden hierarkiaan ryhmiä, alaryhmiä ja kokonaislukuja, jotka kuvastavat mittaa koko organisaatiossa. Tämä on loogisin tapa analysoida liiketoimintaa.

Esimerkiksi on suositeltavaa ryhmitellä kustannukset hierarkkisesti:

OLAPin avulla analyytikot voivat tarkastella yleistä yhteenvetometriikkaa (ylätasolla) ja sitten porautua alaspäin ja sitä seuraaville tasoille löytääkseen tarkan syyn, miksi mittari muuttui.

Antamalla analyytikoille mahdollisuuden käyttää useita ulottuvuuksia datakuutiossa ja kyky muodostaa dimensiot hierarkkisesti, OLAP tarjoaa liiketoiminnasta kuvan, jota tietovarastorakenne ei pakkaa.

Analyysin suunnan muuttaminen kuutiossa (kierrettävä data)

Pääsääntöisesti ne toimivat käsitteillä: sarakkeisiin määritellyt mitat, rivit (niitä voi olla useita), loput lomakeviipaleet, taulukon sisältö lomakkeen dimensiot (myynti, kulut, käteinen)

Tyypillisesti OLAP mahdollistaa kuutioiden mittojen suunnan muuttamisen, jolloin tiedot esitetään eri näkymissä.

Kuutiotietojen näyttö riippuu:

  • dimensiosuuntaukset: mitkä mitat määritetään riveissä, sarakkeissa, viipaleissa;
  • indikaattoriryhmät, korostettu riveillä, sarakkeilla, osioilla.
  • Mittojen muuttaminen kuuluu käyttäjän toimiin.

Siten OLAP antaa sinun suorittaa erilaisia analysoida ja ymmärtää niiden suhteita ja tuloksia.

  • Poikkeamaanalyysi on suunnitelman toteuttamisen analyysi, jota täydennetään poikkeamien syiden tekijäanalyysillä indikaattoreita tarkentamalla.
  • Riippuvuusanalyysi: OLAPin avulla voit tunnistaa erilaisia ​​riippuvuuksia eri muutosten välillä, esimerkiksi kun olut poistettiin valikoimasta kahden ensimmäisen kuukauden aikana, havaittiin särkimyynnissä lasku.
  • Vertailu (vertailuanalyysi). Indikaattorin muutosten tulosten vertailu ajan kuluessa, tietyn tavararyhmän osalta, eri alueilla jne.
  • Dynaamiikan analyysi antaa meille mahdollisuuden tunnistaa tiettyjä suuntauksia indikaattoreiden muutoksissa ajan myötä.

Tehokkuus: voimme sanoa, että OLAP perustuu psykologian lakeihin: kykyyn käsitellä tietopyyntöjä "reaaliajassa" - käyttäjän analyyttisen tietojen ymmärtämisprosessin tahdissa.

Jos relaatiotietokanta voi lukea noin 200 tietuetta sekunnissa ja kirjoittaa 20, niin hyvä OLAP-palvelin voi laskettuja rivejä ja sarakkeita käyttäen yhdistää 20 000-30 000 solua (vastaa yhtä tietuetta relaatiotietokannassa) sekunnissa.

Näkyvyys: On syytä korostaa, että OLAP tarjoaa edistyneitä keinoja tietojen graafiseen esittämiseen loppukäyttäjälle. Ihmisaivot osaa havaita ja analysoida tietoa, joka esitetään geometristen kuvien muodossa, useita suuruusluokkia suuremmassa tilavuudessa kuin aakkosnumeerisessa muodossa esitettyä tietoa. Esimerkki: Oletetaan, että sinun on löydettävä tutut kasvot yhdestä sadasta valokuvasta. Uskon, että tämä prosessi ei vie sinulta enempää kuin minuutin. Kuvittele nyt, että sinulle tarjotaan valokuvien sijaan sata sanallista kuvausta samoista henkilöistä. Uskon, että et pysty ratkaisemaan ehdotettua ongelmaa ollenkaan.

Yksinkertaisuus: Näiden teknologioiden pääominaisuus on, että niitä ei ole tarkoitettu käytettäväksi tietotekniikan alan asiantuntijalle, ei tilastotieteilijälle, vaan alan ammattilaiselle - luottoosaston johtajalle, budjettiosaston johtajalle, ja lopuksi ohjaaja. Ne on suunniteltu analyytikkoa varten kommunikoimaan ongelman kanssa, ei tietokoneen kanssa..

Huolimatta OLAPin mahtavista ominaisuuksista (lisäksi idea on suhteellisen vanha - 60-luku), sen todellista käyttöä yrityksissämme ei käytännössä koskaan löydy. Miksi?

  • ei ole tietoa tai mahdollisuudet eivät ole selkeitä
  • tapa ajatella kaksiulotteisesti
  • hinta este
  • OLAPille omistettujen artikkeleiden liiallinen teknologinen sisältö: epätavalliset termit pelottavat - OLAP, "datan louhinta ja viipalointi", "ad hoc -kyselyt", "merkittävien korrelaatioiden tunnistaminen"

Meidän lähestymistapamme ja länsimaiset OLAPin käyttöön

Lisäksi meillä on myös erityinen käsitys OLAPin sovellusapuohjelmasta, vaikka ymmärrämme sen tekniset ominaisuudet.

Meidän ja venäläiset erilaisten OLAP-materiaalien kirjoittajat ilmaisevat seuraavan näkemyksen OLAPin hyödyllisyydestä: useimmat pitävät OLAPia työkaluna, jonka avulla voit laajentaa ja tiivistää tietoja helposti ja kätevästi suorittamalla analyytikon mieleen tulevat manipulaatiot. analyysiprosessi. Mitä enemmän "viipaleita" ja "osia" tiedosta analyytikko näkee, sitä enemmän hänellä on ideoita, jotka puolestaan ​​vaativat yhä enemmän "viipaleita" todentamiseen. Se ei ole oikein.

Länsimainen ymmärrys OLAPin hyödyllisyydestä perustuu metodologiseen analyysimalliin, joka on otettava huomioon OLAP-ratkaisuja suunniteltaessa. Analyytikon ei tule leikkiä OLAP-kuutiolla ja muuttaa päämäärättömästi sen mittoja ja yksityiskohtia, tiedon suuntausta, datan graafista näyttöä (ja tämä todella vaatii!), vaan ymmärtää selvästi, mitä näkymiä hän tarvitsee, missä järjestyksessä ja miksi (tietysti , elementit ", tässä saattaa olla löytöjä, mutta se ei ole olennaista OLAPin hyödyllisyyden kannalta).

OLAP-sovellukset

  • Budjetti
  • Varojen virtaus

Yksi OLAP-tekniikoiden hedelmällisimmistä sovellusalueista. Ei ole turhaa, että mitään nykyaikaista budjetointijärjestelmää ei pidetä täydellisenä ilman OLAP-työkaluja budjettianalyysiin. Useimmat budjettiraportit rakennetaan helposti OLAP-järjestelmien pohjalta. Samalla raportit vastaavat hyvin monenlaisiin kysymyksiin: kulujen ja tuottojen rakenteen analysointia, eri toimialojen tiettyjen erien kulujen vertailua, tiettyjen erien kulujen dynamiikan ja trendien analysointia, kustannusanalyysiä ja voitot.

OLAPin avulla voit analysoida kassavirtoja ja kassavirtoja liiketoiminnan, vastapuolten, valuuttojen ja ajan yhteydessä niiden virtojen optimoimiseksi.

  • Talous- ja johtamisraportointi (johdon tarvitseman analytiikan kanssa)
  • Markkinointi
  • Tasapainoinen tuloskortti
  • Kannattavuusanalyysi

Jos sinulla on tarvittavat tiedot, voit löytää erilaisia ​​OLAP-tekniikan sovelluksia.

OLAP tuotteet

Tässä osiossa käsitellään OLAP:ia ohjelmistoratkaisuna.

Yleiset vaatimukset OLAP-tuotteille

On monia tapoja toteuttaa OLAP-sovelluksia, joten mitään erityistä tekniikkaa ei olisi pitänyt vaatia tai edes suositella. Eri olosuhteissa ja olosuhteissa yksi lähestymistapa voi olla parempi kuin toinen. Toteutustekniikat sisältävät monia erilaisia ​​patentoituja ideoita, joista toimittajat ovat niin ylpeitä: asiakas-palvelin-arkkitehtuurin muunnelmia, aikasarjaanalyysiä, olioorientaatiota, tiedon tallennuksen optimointia, rinnakkaisia ​​prosesseja jne. Nämä tekniikat eivät kuitenkaan voi kuulua OLAPin määritelmään.

Kaikissa OLAP-tuotteissa (jos kyseessä on OLAP-tuote) on ominaisuuksia, jotka on otettava huomioon, mikä on tekniikan ihanne. Nämä ovat 5 keskeistä määritelmää, jotka luonnehtivat OLAP:ia (ns. FASMI-testiä): Jaetun moniulotteisen tiedon nopea analyysi.

  • Nopeasti(FAST) tarkoittaa, että järjestelmän pitäisi pystyä antamaan useimmat vastaukset käyttäjille noin viiden sekunnin sisällä. Vaikka järjestelmä varoittaa, että prosessi kestää huomattavasti kauemmin, käyttäjät voivat hajaantua ja menettää ajatuksensa, jolloin analyysin laatu kärsii. Tätä nopeutta ei ole helppo saavuttaa suurilla tietomäärillä, varsinkin jos tarvitaan erityisiä lennossa tapahtuvia laskelmia. Toimittajat turvautuvat monenlaisiin menetelmiin saavuttaakseen tämän tavoitteen, mukaan lukien erikoistuneet tietojen tallennusmuodot, laajat esilaskenta tai yhä tiukemmat laitteistovaatimukset. Tällä hetkellä ei kuitenkaan ole olemassa täysin optimoituja ratkaisuja. Ensi silmäyksellä saattaa tuntua yllättävältä, että vastaanotettaessa raporttia minuutissa, joka ei niin kauan sitten kesti päiviä, käyttäjä kyllästyy odottaessaan hyvin nopeasti ja projekti osoittautuu paljon vähemmän onnistuneeksi kuin hetkessä. jopa vähemmän yksityiskohtaisen analyysin kustannuksella.
  • Jaettu tarkoittaa, että järjestelmä mahdollistaa kaikkien tietosuojavaatimusten täyttämisen ja hajautetun ja samanaikaisen pääsyn tietoihin eri käyttäjätasoille. Järjestelmän on kyettävä käsittelemään useita tietomuutoksia oikea-aikaisesti ja turvallisesti. Tämä on suuri heikkous monissa OLAP-tuotteissa, jotka yleensä olettavat, että kaikki OLAP-sovellukset ovat vain luku -muotoisia ja tarjoavat yksinkertaistetut suojaustoiminnot.
  • Moniulotteinen on keskeinen vaatimus. Jos sinun pitäisi määritellä OLAP yhdellä sanalla, valitsisit sen. Järjestelmän on tarjottava moniulotteinen käsitteellinen näkymä tiedoista, mukaan lukien hierarkioiden ja useiden hierarkioiden täydellinen tuki, koska tämä määrittää loogisimman tavan analysoida liiketoimintaa. Käsiteltävien mittojen vähimmäismäärää ei ole, koska se riippuu myös sovelluksesta, ja useimmilla OLAP-tuotteilla on riittävä määrä mittoja niille markkinoille, joille ne on tarkoitettu. Emme myöskään määrittele, mitä taustalla olevaa tietokantatekniikkaa tulisi käyttää, jos käyttäjä haluaa saada todella moniulotteisen käsitteellisen näkemyksen tiedosta. Tämä ominaisuus on OLAPin sydän
  • Tiedot. Tarvittavat tiedot on hankittava sieltä, missä niitä tarvitaan, niiden määrästä ja säilytyspaikasta riippumatta. Paljon riippuu kuitenkin sovelluksesta. Eri tuotteiden teho mitataan sillä, kuinka paljon syöttödataa ne pystyvät käsittelemään, mutta ei sillä, kuinka monta gigatavua ne voivat tallentaa. Tuotteiden teho vaihtelee suuresti – suurimmat OLAP-tuotteet pystyvät käsittelemään vähintään tuhat kertaa enemmän dataa kuin pienimmät. Tässä suhteessa on otettava huomioon monia tekijöitä, mukaan lukien tietojen kopiointi, RAM-vaatimukset, levytilan käyttö, suorituskykymittarit, integrointi tietovarastojen kanssa jne.
  • Analyysi tarkoittaa, että järjestelmä pystyy käsittelemään minkä tahansa tietylle sovellukselle ominaisen loogisen ja tilastollisen analyysin ja varmistaa, että se tallennetaan loppukäyttäjän saatavilla olevassa muodossa. Käyttäjän tulee pystyä määrittelemään uusia mukautettuja laskelmia osana analyysiä ilman ohjelmointia. Eli kaikki tarvittavat analyysitoiminnot on tarjottava intuitiivisella tavalla loppukäyttäjille. Analyysityökalut voivat sisältää tiettyjä toimenpiteitä, kuten aikasarjaanalyysiä, kustannusten allokointia, valuutansiirtoja, kohdehakuja jne. Tällaiset ominaisuudet vaihtelevat suuresti tuotteiden välillä riippuen kohdesuuntautumisesta.

Toisin sanoen nämä 5 keskeistä määritelmää ovat tavoitteita, joita OLAP-tuotteet on suunniteltu saavuttamaan.

OLAPin tekniset näkökohdat

OLAP-järjestelmä sisältää tiettyjä osia. Niiden toiminnalle on olemassa erilaisia ​​järjestelmiä, joita tämä tai tuo tuote voi toteuttaa.

OLAP-järjestelmien komponentit (mistä OLAP-järjestelmä koostuu?)

Tyypillisesti OLAP-järjestelmä sisältää seuraavat osat:

  • Tietolähde
    Lähde, josta analyysitiedot on otettu (tietovarasto, operatiivisten kirjanpitojärjestelmien tietokanta, taulukkosarja, edellä mainittujen yhdistelmät).
  • OLAP-palvelin
    Lähteen tiedot siirretään tai kopioidaan OLAP-palvelimelle, jossa ne systematisoidaan ja valmistetaan nopeampaa vastausten tuottamista kyselyihin.
  • OLAP-asiakas
    Käyttöliittymä OLAP-palvelimeen, jossa käyttäjä toimii

On huomattava, että kaikkia komponentteja ei vaadita. On olemassa työpöydän OLAP-järjestelmiä, joiden avulla voit analysoida suoraan käyttäjän tietokoneelle tallennettuja tietoja ja jotka eivät vaadi OLAP-palvelinta.

Vaadittava elementti on kuitenkin tietolähde: tiedon saatavuus on tärkeä kysymys. Jos ne ovat missä tahansa muodossa, kuten Excel-taulukossa, kirjanpitojärjestelmän tietokannassa tai sivukonttoreiden jäsenneltyjen raporttien muodossa, IT-asiantuntija pystyy integroitumaan OLAP-järjestelmään suoraan tai välimuunnolla. OLAP-järjestelmissä on tähän erikoistyökalut. Jos näitä tietoja ei ole saatavilla tai ne eivät ole riittävän täydellisiä ja laadukkaita, OLAP ei auta. Toisin sanoen OLAP on vain datan ylärakenne, ja jos sellaista ei ole, siitä tulee hyödytön asia.

Suurin osa OLAP-sovellusten tiedoista on peräisin muista järjestelmistä. Joissakin sovelluksissa (esimerkiksi suunnittelussa tai budjetointissa) tietoja voidaan kuitenkin luoda suoraan OLAP-sovelluksissa. Kun tiedot tulevat muista sovelluksista, tiedot on yleensä tallennettava erilliseen kahteen muotoon OLAP-sovellukselle. Siksi on suositeltavaa luoda tietovarastoja.

On huomattava, että termi "OLAP" liittyy erottamattomasti termiin "tietovarasto" (Data Warehouse). Tietovarasto on toimialuekohtainen, aikaperusteinen ja muuttumaton tiedon kokoelma, joka tukee johdon päätöksentekoa. Varaston tiedot tulevat operatiivisista järjestelmistä (OLTP-järjestelmät), jotka on suunniteltu automatisoimaan liiketoimintaprosesseja, varastoa voidaan täydentää ulkoisista lähteistä, esimerkiksi tilastoraporteista.

Huolimatta siitä, että ne sisältävät ilmeisen ylimääräistä tietoa, joka on jo tietokannoissa tai käyttöjärjestelmätiedostoissa, tietovarastot ovat välttämättömiä, koska:

  • tietojen pirstoutuminen, tallentaminen erilaisiin DBMS-muotoihin;
  • tiedonhaun suorituskyky paranee
  • jos yrityksessä kaikki tiedot on tallennettu keskustietokantapalvelimelle (mikä on erittäin harvinaista), analyytikko ei todennäköisesti ymmärrä niiden monimutkaisia, joskus hämmentäviä rakenteita
  • monimutkaiset analyyttiset operatiivisen tiedon kyselyt hidastavat yrityksen nykyistä työtä, estävät taulukoita pitkäksi aikaa ja ottavat haltuunsa palvelinresursseja
  • kyky puhdistaa ja harmonisoida tietoja
  • käyttöjärjestelmien tietojen suora analysointi on mahdotonta tai erittäin vaikeaa;

Arkiston tarkoituksena on tarjota "raaka-aine" analysointiin yhdessä paikassa ja yksinkertaisessa, ymmärrettävässä rakenteessa. Toisin sanoen Data Warehousing -käsite ei ole data-analyysin käsite, vaan se on käsite tietojen valmistelusta analysointia varten. Se sisältää yhden integroidun tietolähteen toteuttamisen.

OLAP-tuotteet: arkkitehtuurit

OLAP-tuotteita käytettäessä on kaksi tärkeää kysymystä: miten ja missä pitää Ja käsitellä asiaa tiedot. OLAP-arkkitehtuurit erotetaan sen mukaan, miten nämä kaksi prosessia on toteutettu. On kolme tapaa tallentaa tietoja OLAP:ia varten ja kolme tapaa käsitellä näitä tietoja. Monet valmistajat tarjoavat useita vaihtoehtoja, jotkut yrittävät todistaa, että heidän lähestymistapansa on järkevin yksittäinen. Tämä on tietysti absurdia. Hyvin harvat tuotteet voivat kuitenkin toimia tehokkaasti useammassa kuin yhdessä tilassa.

OLAP-tietojen tallennusvaihtoehdot

Tallennus tarkoittaa tässä yhteydessä tietojen pitämistä jatkuvasti päivitetyssä tilassa.

  • Relaatiotietokannat: Tämä on tyypillinen valinta, jos yritys tallentaa kirjanpitotiedot RDB:hen. Useimmissa tapauksissa tiedot tulee tallentaa denormalisoituun rakenteeseen (sopivin on tähtiskeema). Normalisoitu tietokanta ei ole hyväksyttävä, koska kyselyn suorituskyky on erittäin alhainen luotaessa aggregaatteja OLAP:ia varten (usein tuloksena saadut tiedot tallennetaan aggregaattitaulukoihin).
  • Tietokantatiedostot päällä asiakastietokone(kioskit tai datamarkkinat): Nämä tiedot voidaan jakaa valmiiksi tai luoda pyynnöstä asiakastietokoneille.

Moniulotteiset tietokannat: Tämä olettaa, että tiedot on tallennettu moniulotteiseen tietokantaan palvelimella. Se voi sisältää muista järjestelmistä ja relaatiotietokannoista poimittuja ja yhteenvetotietoja, loppukäyttäjien tiedostoja jne. Useimmissa tapauksissa moniulotteiset tietokannat tallennetaan levylle, mutta joissakin tuotteissa voit käyttää RAM-muistia, joka laskee useimmin käytetyt tiedot lennossa. " Hyvin harvat moniulotteisiin tietokantoihin perustuvat tuotteet mahdollistavat tietojen usean muokkauksen; monet tuotteet mahdollistavat yhden muokkauksen mutta useiden tietojen lukemisen, kun taas toiset rajoittuvat vain lukemiseen.

Näillä kolmella säilytyspaikalla on erilaiset tallennusominaisuudet, ja ne on järjestetty kapasiteetin mukaan laskevaan järjestykseen. Niillä on myös erilaiset kyselyn suorituskykyominaisuudet: relaatiotietokannat ovat paljon hitaampia kuin kaksi jälkimmäistä vaihtoehtoa.

Vaihtoehdot OLAP-tietojen käsittelyyn

On olemassa 3 samaa tietojenkäsittelyvaihtoehtoa:

  • SQL:n käyttö: Tätä vaihtoehtoa käytetään tietysti tallennettaessa tietoja RDB:hen. SQL ei kuitenkaan salli moniulotteisia laskelmia yhdessä kyselyssä, joten se vaatii kirjoittamisen monimutkaiset SQL-kyselyt saavuttaakseen vain tavallisen moniulotteisen toiminnallisuuden. Tämä ei kuitenkaan estä kehittäjiä yrittämästä. Useimmissa tapauksissa he suorittavat rajoitetun määrän relevantteja laskelmia SQL:ssä, joiden tulokset voidaan saada moniulotteisesta tietojenkäsittelystä tai asiakaskoneesta. On myös mahdollista käyttää RAM-muistia, joka voi tallentaa tietoja useammalla kuin yhdellä pyynnöllä: tämä parantaa huomattavasti vastausta.
  • Moniulotteinen käsittely asiakkaalla: Asiakas-OLAP-tuote tekee laskelmat itse, mutta tällainen käsittely on käytettävissä vain, jos käyttäjillä on suhteellisen tehokkaat tietokoneet.

Palvelinpuolen moniulotteinen käsittely: Tämä on suosittu paikka tehdä moniulotteisia laskelmia asiakas-palvelin OLAP-sovelluksissa, ja sitä käytetään monissa tuotteissa. Suorituskyky on yleensä korkea, koska suurin osa laskelmista on jo tehty. Tämä vaatii kuitenkin paljon levytilaa.

OLAP-arkkitehtuurien matriisi

Vastaavasti yhdistämällä tallennus-/käsittelyvaihtoehtoja on mahdollista saada matriisi OLAP-järjestelmäarkkitehtuureista. Vastaavasti näistä menetelmistä voi teoriassa olla 9 yhdistelmää. Koska 3 niistä kuitenkin puuttuu tervettä järkeä, todellisuudessa on vain 6 vaihtoehtoa tallentaa ja käsitellä OLAP-tietoja.

Moniulotteiset tallennusvaihtoehdot
tiedot

Vaihtoehdot
moniulotteinen
tietojenkäsittely

Relaatiotietokanta

Palvelinpuolen moniulotteinen tietokanta

Asiakastietokone

Cartesis-suuruus

Moniulotteinen palvelinkäsittely

Crystal Holos (ROLAP-tila)

IBM DB2 OLAP Server

CA EUREKA: Strategia

Informix MetaCube

Speedware Media/MR

Microsoftin analyysipalvelut

Oracle Express (ROLAP-tila)

Pilottianalyysipalvelin

Sovellus iTM1

Crystal Holos

Comshare päätös

Hyperion Essbase

Oracle Express

Speedware Media/M

Microsoftin analyysipalvelut

PowerPlay Enterprise Server

Pilottianalyysipalvelin

Sovellus iTM1

Moniulotteinen käsittely asiakastietokoneessa

Oracle Discoverer

Informix MetaCube

Dimensiaalinen näkemys

Hyperion Enterprise

Cognos PowerPlay

Personal Express

iTM1:n näkökulmat

Koska käsittely määrää tallennustilan, on tapana ryhmitellä tallennusvaihtoehtojen mukaan, eli:

  • ROLAP-tuotteet aloilla 1, 2, 3
  • Työpöydän OLAP - sektorissa 6

MOLAP-tuotteet – sektoreilla 4 ja 5

HOLAP-tuotteet (jotka mahdollistavat sekä moniulotteisen että relaatiotiedon tallennusvaihtoehdot) – 2 ja 4 (kursiivilla)

OLAP-tuotteiden luokat

OLAP-toimittajia on yli 40, vaikka kaikkia ei voida pitää kilpailijoina, koska niiden ominaisuudet ovat hyvin erilaisia ​​ja itse asiassa ne toimivat eri markkinasegmenteillä. Ne voidaan ryhmitellä 4 perusluokkaan, joiden väliset erot perustuvat seuraaviin käsitteisiin: monimutkainen toiminnallisuus - yksinkertainen toiminnallisuus, suorituskyky - levytila. Kategoriat on hyödyllistä kuvata neliön muotoisina, koska se näyttää selkeästi niiden väliset suhteet. Kunkin luokan erottuva piirre on edustettuna sen puolella, ja samankaltaisuudet muiden kanssa ovat edustettuina vierekkäisillä puolilla, joten vastakkaisilla puolilla olevat luokat ovat pohjimmiltaan erilaisia.

Erikoisuudet

Edut

Vikoja

edustajat

Sovellettu OLAP

Täydelliset sovellukset runsaalla toiminnallisuudella. Melkein kaikki vaativat moniulotteisen tietokannan, vaikka jotkut toimivat relaatiotietokannan kanssa. Monet tämän kategorian sovelluksista ovat erikoistuneita, kuten myynti, valmistus, pankkitoiminta, budjetointi, taloudellinen konsolidointi, myyntianalyysi

Mahdollisuus integroida eri sovelluksiin

Korkea toiminnallisuus

Korkea joustavuus ja skaalautuvuus

Sovelluksen monimutkaisuus (vaatii käyttäjän koulutusta)

Korkea hinta

Hyperion-ratkaisut

Kristallipäätökset

Tietojen rakentajat

Tuote perustuu ei-relaatiotietorakenteeseen, joka tarjoaa moniulotteisen tiedon tallennuksen, käsittelyn ja esittämisen. Analyysin aikana data valitaan yksinomaan moniulotteisesta rakenteesta. Korkeasta avoimuudesta huolimatta toimittajat houkuttelevat ostajia ostamaan omia työkalujaan

Korkea suorituskyky (nopeat yhteenvetoindikaattoreiden laskelmat ja erilaiset moniulotteiset muunnokset mille tahansa ulottuvuudelle). Keskimääräinen vastausaika ad hoc -analyyttiseen kyselyyn moniulotteista tietokantaa käytettäessä on yleensä 1-2 suuruusluokkaa pienempi kuin RDB:n tapauksessa

Korkea avoimuus: suuri määrä tuotteita, joiden kanssa integrointi on mahdollista

He selviävät helposti erilaisten sisäänrakennettujen toimintojen sisällyttämisestä tietomalliin, käyttäjän suorittaman erikoisanalyysin suorittamisesta jne.

Suuren levytilan tarve tietojen tallentamiseen (tallennettujen tietojen redundanssin vuoksi). Tämä on erittäin tehotonta muistin käyttöä - denormalisoinnin ja esisuoritetun aggregoinnin vuoksi moniulotteisen tietokannan datamäärä vastaa 2,5-100 kertaa vähemmän kuin alkuperäisen yksityiskohtaisen tiedon määrä. Joka tapauksessa MOLAP ei salli työskentelyä suurten tietokantojen kanssa. Todellinen raja on 10-25 gigatavun tietokanta

Tietokannan "räjähdyksen" mahdollisuus on sen määrän odottamaton, jyrkkä ja suhteeton kasvu

Joustavuuden puute tietorakenteiden muokkaamisessa. Mikä tahansa muutos mittojen rakenteessa vaatii melkein aina hyperkuution täydellisen uudelleenjärjestelyn

Moniulotteisille tietokannoille ei tällä hetkellä ole yhtenäisiä standardeja käyttöliittymälle, kielille tietojen kuvaamiseen ja käsittelyyn

Hyperion (Essbase)

DOLAP (työpöydän OLAP)

Asiakkaan OLAP-tuotteet, jotka ovat melko helppoja ottaa käyttöön ja joiden istuinkohtainen hinta on alhainen

Puhumme sellaisesta analyyttisestä käsittelystä, jossa hyperkuutiot ovat pieniä, niiden koko on pieni, tarpeet vaatimattomat ja tällaiseen analyyttiseen käsittelyyn riittää henkilökohtainen kone työpöydällä

Näiden markkinoiden tuottajien tavoitteena on automatisoida satoja ja tuhansia työpaikkoja, mutta käyttäjien on suoritettava melko yksinkertainen analyysi. Ostajia kannustetaan usein ostamaan enemmän työpaikkoja kuin on tarpeen

Hyvä integrointi tietokantoihin: moniulotteinen, relaatio

Mahdollisuus tehdä monimutkaisia ​​hankintoja, mikä vähentää toteutusprojektien kustannuksia

Sovellusten helppokäyttöisyys

Erittäin rajoitettu toiminnallisuus (ei tässä suhteessa verrattavissa erikoistuotteisiin)

Erittäin rajoitettu teho (pienet datamäärät, pieni määrä mittauksia)

Cognos (PowerPlay)

Business Objects

Kristallipäätökset

Tämä on markkinoiden pienin sektori.

Yksityiskohtaiset tiedot säilyvät siellä, missä ne alun perin olivat - relaatiotietokannassa; Jotkut aggregaatit on tallennettu samaan tietokantaan erityisesti luotuissa palvelutaulukoissa

Pystyy käsittelemään erittäin suuria tietomääriä (kustannustehokas tallennustila)

Tarjoa monen käyttäjän toimintatila, mukaan lukien muokkaustila, ei vain lukemista

Korkeampi tietosuojan taso ja hyvät vaihtoehdot käyttöoikeuksien eriyttämiseen

Säännölliset muutokset mittausrakenteeseen ovat mahdollisia (ei vaadi tietokannan fyysistä uudelleenjärjestelyä)

Alhainen suorituskyky, huomattavasti huonompi vastausnopeuden suhteen kuin moniulotteisten (vastaus monimutkaisiin kyselyihin mitataan minuuteissa tai jopa tunteissa sekuntien sijaan). Nämä ovat parempia raporttien rakentajia kuin interaktiivisia analytiikkatyökaluja

Tuotteiden monimutkaisuus. Vaatii tietotekniikan asiantuntijoilta huomattavia ylläpitokustannuksia. Jotta relaatiojärjestelmät voisivat tarjota MOLAPiin verrattavan suorituskyvyn, ne vaativat tietokantaskeeman huolellista suunnittelua ja indeksien määrittämistä, eli tietokannan ylläpitäjiltä paljon vaivaa.

Kallis toteuttaa

SQL:n rajoitukset ovat edelleen todellisuutta, mikä estää monien sisäänrakennettujen toimintojen toteuttamisen RDBMS:ssä, jotka ovat helposti saatavilla järjestelmissä, jotka perustuvat tietojen moniulotteiseen esitykseen.

Tietoetu

Informix (MetaCube)

On huomattava, että ROLAP- ja MOLAP-tilan valinnan mahdollistavien hybridituotteiden, kuten Microsoft Analysis Services, Oracle Express, Crystal Holos, IBM DB2 OLAPServer, kuluttajat valitsevat lähes aina MOLAP-tilan.

Jokaisella esitetyllä kategorialla on omat vahvuutensa ja heikkoutensa, ketään ei ole optimaalinen valinta. Valinta vaikuttaa kolmeen tärkeään näkökohtaan: 1) suorituskyky; 2) levytilaa tietojen tallentamista varten; 3) OLAP-ratkaisun ominaisuudet, toimivuus ja erityisesti skaalautuvuus. Tässä tapauksessa on otettava huomioon käsiteltävän tiedon määrä, laitteiden teho, käyttäjien tarpeet ja etsittävä kompromissi nopeuden ja tietokannan käyttämän levytilan redundanssin, yksinkertaisuuden ja monipuolisuuden välillä.

Tietovarastojen luokittelu kohdetietokannan määrän mukaan

OLAPin haitat

Kuten millä tahansa tekniikalla, OLAPilla on myös haittapuolensa: korkeat vaatimukset laitteistolle, hallintohenkilöstön ja loppukäyttäjien koulutus ja tietämys, korkeat toteutusprojektin toteuttamiskustannukset (sekä rahalliset että ajalliset, henkiset).

OLAP-tuotteen valinta

Oikean OLAP-tuotteen valitseminen on vaikeaa, mutta erittäin tärkeää, jos haluat, että projekti ei epäonnistu.

Kuten näet, tuoteerot ovat monilla alueilla: toiminnallinen, arkkitehtoninen, tekninen. Joidenkin tuotteiden asetukset ovat hyvin rajalliset. Jotkut on luotu erikoistuneille aihealueille: markkinointi, myynti, rahoitus. On yleiskäyttöön tarkoitettuja tuotteita, joilla ei ole sovelluskohtaista käyttöä, vaan niiden on oltava melko joustavia. Yleensä tällaiset tuotteet ovat halvempia kuin erikoistuneet, mutta toteutuskustannukset ovat korkeammat. OLAP-tuotteiden valikoima on erittäin laaja - yksinkertaisimmista työkaluista toimistotuotteisiin kuuluvien pivot-taulukoiden ja -kaavioiden rakentamiseen, datan analysointi- ja mallihakutyökaluihin, jotka maksavat kymmeniä tuhansia dollareita.

Kuten millään muullakaan alalla, OLAP-alalla ei voi olla selkeitä ohjeita työkalujen valinnasta. Voit keskittyä vain useisiin avainkohtiin ja verrata ehdotettuja ohjelmistoominaisuuksia organisaation tarpeisiin. Yksi asia on tärkeä: jos ajattelet kunnolla, miten aiot käyttää OLAP-työkaluja, saatat aiheuttaa itsellesi suuren päänsäryn.

Valintaprosessin aikana on otettava huomioon kaksi kysymystä:

  • arvioida yrityksen tarpeita ja kykyjä
  • arvioida markkinoiden olemassa olevaa tarjontaa, myös kehitystrendit ovat tärkeitä

Vertaa sitten kaikkea tätä ja itse asiassa tee valinta.

Tarvitsee arviointia

Et voi tehdä järkevää tuotevalintaa ymmärtämättä mihin sitä käytetään. Monet yritykset haluavat "parhaan mahdollisen tuotteen" ilman selkeää ymmärrystä siitä, miten sitä tulisi käyttää.

Jotta projekti toteutuisi onnistuneesti, talousjohtajan tulee vähintään osaavasti muotoilla toiveensa ja vaatimuksensa johtajalle jae. Monet ongelmat johtuvat riittämättömästä valmistautumisesta ja tietoisuudesta OLAPin valintaan: IT-asiantuntijoilla ja loppukäyttäjillä on kommunikaatiovaikeuksia yksinkertaisesti siksi, että he manipuloivat keskustelun aikana erilaisia ​​käsitteitä ja termejä ja esittävät ristiriitaisia ​​mieltymyksiä. Tavoitteiden tulee olla johdonmukaisia ​​yrityksen sisällä.

Jotkut tekijät ovat jo tulleet ilmeisiksi luettuaan yleiskatsauksen OLAP-tuotekategorioista, nimittäin:

Tekniset näkökohdat

  • Tietolähteet: yrityksen tietovarasto, OLTP-järjestelmä, taulukkotiedostot, relaatiotietokannat. Mahdollisuus linkittää OLAP-työkalut kaikkiin organisaatiossa käytettyihin tietokantajärjestelmiin. Kuten käytäntö osoittaa, heterogeenisten tuotteiden integrointi vakaaseen käyttöjärjestelmään on yksi tärkeimmistä kysymyksistä, ja sen ratkaisuun voi joissain tapauksissa liittyä suuria ongelmia. On ymmärrettävä, kuinka yksinkertaisesti ja luotettavasti on mahdollista integroida OLAP-työkalut organisaatiossa olemassa olevaan DBMS-järjestelmään. On myös tärkeää arvioida integroinnin mahdollisuuksia tietolähteiden lisäksi myös muiden sovellusten kanssa, joihin saatat joutua viemään tietoja: sähköposti, toimistosovellukset
  • Tietojen vaihtelu otetaan huomioon
  • Palvelinalusta: NT, Unix, AS/400, Linux – mutta älä vaadi, että OLAP-määritystuotteet toimivat kyseenalaisilla tai kuolevaisilla alustoilla, joita käytät edelleen
  • Asiakaspuolen ja selainstandardit
  • Käyttöönotettava arkkitehtuuri: paikallinen verkko- ja PC-modeemiyhteys, nopea asiakas/palvelin, intranet, extranet, Internet
  • Kansainväliset ominaisuudet: usean valuutan tuki, monikieliset toiminnot, tietojen jakaminen, lokalisointi, lisensointi, Windows-päivitys

Käytettävissä olevien ja tulevaisuudessa ilmestyvien syöttötietojen määrä

Käyttäjät

  • Sovellusalue: myynti/markkinointianalyysi, budjetointi/suunnittelu, tulosanalyysi, kirjanpitoraporttien analyysi, laadullinen analyysi, taloudellinen tilanne, analyyttisten materiaalien (raporttien) tuottaminen
  • Käyttäjien lukumäärä ja sijainti, vaatimukset tietojen ja toimintojen käyttöoikeuksien jakamiselle, tietojen salassapito (luottamuksellisuus)
  • Käyttäjätyyppi: ylin johto, talous, markkinointi, HR, myynti, tuotanto jne.
  • Käyttäjäkokemus. Käyttäjän taitotaso. Harkitse koulutuksen järjestämistä. On erittäin tärkeää, että OLAP-asiakassovellus on suunniteltu siten, että käyttäjät tuntevat olonsa itsevarmaksi ja voivat käyttää sitä tehokkaasti.

Tärkeimmät ominaisuudet: Tietojen takaisinkirjoitustarpeet, hajautettu laskenta, monimutkaiset valuuttamuunnokset, raporttien tulostustarpeet, laskentataulukkoliittymä, sovelluslogiikan monimutkaisuus, vaaditut mitat, analyysityypit: tilastollinen, tavoitehaku, entä jos -analyysi

Toteutus

  • Ketkä ovat mukana toteutuksessa ja käytössä: ulkopuoliset konsultit, sisäinen IT-toiminto vai loppukäyttäjät
  • Budjetti: ohjelmisto, laitteistot, palvelut, tiedonsiirto. Muista, että OLAP-tuotelisenssien maksaminen on vain pieni osa projektin kokonaiskustannuksista. Käyttöönotto- ja laitteistokustannukset voivat olla enemmän kuin lisenssimaksu, ja pitkän aikavälin tuki-, käyttö- ja hallintokustannukset ovat lähes varmasti huomattavasti suuremmat. Ja jos teet väärän päätöksen ostaa väärä tuote vain siksi, että se on halvempaa, saatat päätyä korkeampiin projektin kokonaiskustannuksiin korkeampien ylläpito-, hallinto- ja/tai laitteistokustannusten vuoksi, minkä vuoksi saat todennäköisesti vähemmän liiketoimintaetuja . Kun arvioit kokonaiskustannuksia, muista esittää seuraavat kysymykset: Kuinka laajat toteutus-, koulutus- ja tukilähteet ovat saatavilla? Kasvaako tai pieneneekö mahdollinen yleinen rahasto (työntekijät, urakoitsijat, konsultit)? Kuinka laajasti voit hyödyntää teollista ammattikokemustasi?

Huolimatta siitä, että analyyttisten järjestelmien kustannukset ovat edelleen melko korkeat ja menetelmät ja tekniikat tällaisten järjestelmien toteuttamiseksi ovat vielä lapsenkengissään, nykyään niiden tuottama taloudellinen vaikutus ylittää huomattavasti perinteisten toimintajärjestelmien vaikutuksen.

Liiketoiminnan kehittämisen oikean organisoinnin, strategisen ja operatiivisen suunnittelun vaikutusta on vaikea arvioida etukäteen, mutta on selvää, että se voi ylittää tällaisten järjestelmien toteuttamisen kustannukset kymmeniä ja jopa satoja kertoja. Ei kuitenkaan pidä erehtyä. Vaikutusta ei takaa itse järjestelmä, vaan sen parissa työskentelevät ihmiset. Siksi lausunnot, kuten: "Data Warehousing- ja OLAP-tekniikoiden järjestelmä auttaa johtajaa tekemään oikeita päätöksiä" eivät ole täysin oikeita. Nykyaikaiset analyyttiset järjestelmät eivät ole tekoälyjärjestelmiä, eivätkä ne voi auttaa tai estää päätöksentekoa. Heidän tavoitteenaan on tarjota johtajalle nopeasti kaikki päätöksen tekemiseen tarvittavat tiedot kätevässä muodossa. Ja mitä tietoja pyydetään ja mikä päätös sen perusteella tehdään, riippuu vain tietystä henkilöstä, joka sitä käyttää.

On vielä sanottava, että nämä järjestelmät voivat auttaa ratkaisemaan monia liiketoimintaongelmia ja niillä voi olla kauaskantoisia myönteisiä vaikutuksia. Nähtäväksi jää, kuka ensimmäisenä ymmärtää tämän lähestymistavan edut ja on muita edellä.