Model Pengembangan Data Warehouse dan Data Multi Dimensi pada Data Warehouse

 

Nama               : Ni Nyoman Indri Wika Astuti
NIM                 : 1805551014
Dosen              : I Putu Agus Eka Pratama, S.T., M.T
Mata Kuliah    : Data Warehouse
Program Studi : Teknologi Informasi, Fakultas Teknik, Universitas Udayana

 

MODEL PENGEMBANGAN DATA WAREHOUSE

Data warehouse memiliki perbedaan dengan data transaksional yang mengutamakan perubahan data didalamnya dimana data warehouse lebih memperhatikan data historis yang dimiliki yang bertujuan untuk kebuthan analisa data. Data warehouse merupakan tempat penyimpanan data (gudang data) dimana proses pengumpulan data bisa didapatkan dari berbagai sumber, memiliki format data yang beragam dan juga banyaknya kebutuhan pengguna yang menggunakannya, oleh karena itu data warehouse dibagi lagi menjadi sub data yang dapat disebut dengan data mart.

Data mart merupakan sub bagian (unit) dari data warehouse keseluruhan yang berada pada layer akses (accsess layer) sebagai sebuah struktur data yang di dalamnya memuat data spesifik bisnis proses, guna memudahkan pengguna akhir di dalam mengakses data dari data warehouse sesuai kebutuhan ataupun analisa data. Contoh data mart dan data warehouse misalnya pada kasus universitas yang memiliki data yang berasal dari banyak fakultas ataupun ukm yang disimpan dalam suatu data warehouse sementara data mart pada studi kasus ini seperti data fakultas pada universitas.

Model pengembangan data warehouse terdiri dari 6 model namun model – model tersebut dikategorikan lagi menjadi 2 kategori yaitu tanpa menggunakan user feedback dan yang menggunakan user feedback dimana masing masing pemodelannya bisa dipilih sesuai dengan kebutuhan instansi/organisasi/ pengguna, budget, ketersediaan resource dan latar belakang diperlukan data warehouse dalam instansi. Kedua kategori ini sama – sama terdiri dari model top down, bottom up dan juga parallel serta wajib terdapat data model (pemodelan data) yang bertujuan agar data mart tidak sepenuhnya bergantuk ke data warehouse. Perbedaan kedua kategori terdapat pada “dengan user feedback” dan “tanpa user feedback” dimana user feedback yang dimaksudkan diletakkan pada tatap muka aplikasi data warehouse sehingga mempengaruhi bagaimana data warehouse dan data mart yang dibangun tersebut untuk ke depannya yang dijelaskan sebagai berikut:

      1.    Top Down Tanpa User Feedback 

            Top down model tanpa user feedback merupakan pengembangan model data warehouse yang paling sederhana karena tidak melibatkan user feedback dan juga alurnya yang berawal dari sumber data (data source) yang diteruskan ke data warehouse untuk kemudian dipecah dan diteruskan ke dalam beberapa buah data mart. model data warehouse ini berfokus pada kemampuan untuk dapat menjadikan pengguna memperoleh data sesuai kebutuhan melalui data mart tanpa melakukan pengubahan apapun pada data warehouse itu sendiri.

  

        2.     Bottom Up Tanpa User Feedback

Bottom up tanpa user feedback merupakan kebalikan dari pengembangan model data warehouse top down tanpa user feedback yang sudah dijelaskan sebelumnya. Model pengembangan data warehouse ini memulai proses dari bawah dimana dua buah atau lebih data mart dibentuk dari data yang berasal dari berbagai sumber data (data source) dengan melalui dua tahapan yaitu:

   -    ETT (Extraction, Transformation, Transportation) yaitu pemindaian sumber data ke masing –          masing data mart

   -    Data yang dari setiap data mart kembali diintegrasikan di dalam data warehouse dengan                 menggunakan proses ETT kemudian juga dilakukan penghilangan redundancy pada data yang           berasal dari sejumlah data mart

      

        3.     Paralel Tanpa User Feedback

    Parallel tanpa user feedback merupakan modifikasi dari model top down tanpa user feedback yang sebelumnya dijelaskan namun data mart pada model ini tidak sepenuhnya bergantug ke data warehouse dalam hal sumber data yang diperoleh seperti halnya pada model top down. Terdapat beberapa tahap yang di lalui pada model parallel ini yaitu:

-          Membangun data warehouse dari berbagai sumber data yang didalamnya terdapat data model untuk menjadi acuan bagi model data untuk data mart yang akan dibentuk kemudian.Data mart terbentuk dan ikut berperan dalam membangun data warehouse melalui integrasi di level data.



Pada ilustrasi diatas menunjukkan aliran data dari data warehouse ke data mart namun data dari data mart tidak masuk ke data warehouse lagi dikarenakan pengembangan model ini memiliki role dalam bentuk data model yang berasal dari data warehouse ke data mart namum bukan jika diperlukan data yang berasal dari data mart dapat dimasukkan ke data warehouse.

     

    4.         Top Down Beserta User Feedback

    Model data warehouse ini terdiri dari sejumlah data dari berbagai sumber data membentuk data warehouse sebagai pusat penggudangan data, kemudian terjadi proses integrasi data di level data sehingga mudah disatukan ke dalam sebuah gudang data. Data warehouse kemudian dibagi menjadi sejumlah data mart sesuai dengan kebutuhan pengguna, user feedback mempengaruhi data mart daan secara otomatis mempengaruhi data warehouse sehingga menjadi tolak ukur dalam pengembangan berkelanjutan data mart dan data warehouse. Pengembangan model data warehouse ini memiliki aliran bolak – balik dari user feedback (pengguna) ke data mart dan dari data mart ke data warehouse.




        5.     Bottom Up Beserta User feedback

   Model data warehouse ini dibentuk dari 2 data mart atau lebih menggunakan data dari berbagai sumber data dimana dalam pengumpulan daya, ekstraksi data transformasi data dan integrasi di level data itu sendiri dibantu dengan ETT, kemudian dibentuk wata warehouse dari data mart tersebut kembali menggunakan ETT untuk mengintrasikan data dari berbagai data mart ke dalam kesatuan data warehouse. User feedback model ini diarahkan melalui tatap muka data warehouse yang berefek terhadap data mart yang membentuk data warehouse.

 



        6.     Paralel Beserta user Feedback

    Mekanisme pembentukan model data dari pengembangan model data warehouse ini berasal dari berbagai sumber data dimana selanjutnya akan dimasukkan ke dalam data mart dan ke data warehouse. Sumber data akam melalui proses ETT terlebih dahulu sebelum menuju ke data mart kemudian data yang akan menuju ke data model untuk menyeragamkan format sebelum nantinya diteruskan ke data warehouse. Data yang ada di data warehouse tidak mengalami proses ETT lagi karena data warehouse merupakan pusat untuk model data enterprise yang menjadi acuan bagi data mart lainnya. data warehouse mengumpulkan data, memuat fungsi koordinat dan integrative untuk pengembangan ke depannya termasuk manajemen data dan informasi kepada pengguna. User feedback dialirkan melalui tatap muka ke data mart.

 



 

DATA RELASIONAL VS DATA MULTI DIMENSI

    1.     Data Relasional

Data relasional atau relasional data modelling (RDM) dipandang sebagai bentuk hubungan antar data (melalui tabel) yang saling berelasi dalam struktur hirarkis dan berada pada 2 dimensi (baris dan kolom) dimana relasi yang dikenal terdiri dari one to one, one to many dan many to many. Data relasional merupakan data transaksional, manipulasi data, tanpa menyimpan data historis.

 

    2.    Data multi dimensi

Data multi dimensi (Multi dimensional Data atau MDD) merupakan model data fisik yang strukturnya dapat dilihat dari berbagai sudat pandang (dimensi) dengan tiga buah bagian (record atau baris, field atau kolom dan layer) dengan objek – objek data multi dimensi di dalamnya. Atribut pada data multi dimensi dibedakan menjadi atribut dimensi dan atribut pengukuran. Kegunaan data multi dimensi ini adalah untuk memudahkan dalam melakukan analisa data sehingga data ini juga mengutamakan data historis berbeda dengan database biasa yang berupa data transaksional. Data multi dimensi jika direpresenasikan ke dalam bentuk koordinat maka dapat ditunjukkan ke dalam tiga buah sumbu (X, Y dan Z).  contohya Misalkan saja dimensi yang digunakan untuk melihat data mahasiswa adalah dimensi kelulusan, dimensi sidang TA, dan dimensi wisuda. Masing – masing dari dimensi tersebut, akan membentuk Tabel Kelulusan, Tabel Sidang_TA, dan Tabel Wisuda, dengan perincian sebagai berikut :

-          Tabel Kelulusan, Field : ID_Kelulusan (Primary Key), NIM, Nama, Angkatan, IPK.

-          Tabel Sidang_TA, Field : ID_Sidang, NIM, Nama, Judul, Pembimbing, Penguji, Kelulusan, Nilai.

-          Tabel Wisuda, Field : ID_Wisuda, NIM, Nama, Periode Wisuda

 

 

Data multi dimensi tidak dapat lepas dari kebutuhan untuk mempermudah analisa data dengan menggunkan proses OLTP(On Line Transactional Data) yang digunakan untuk memproses data transaksional namun tidak menyimpan data historis karena hanya untuk kebutuhan data dan informasi semata.

Proses OLAP (On Line Analytical Data) yang digunakan untuk menganalisa data yang berasal dari data transaksi (OLTP) dengan mengutamakan historis data maka data perlu dilihat dari 3 atau lebih dimensi untuk kemudahan analisa data.

Slicing data atau pemotongan data berlapis – lapis, diasumsikan untuk mengambil data yang relevan untuk kebutuhan analisa.

 

Reference

Rifzan. (2019, maret 26). Penjelasan Tentang Pengertian Data Mart dan Fungsinya. Retrieved from ribocom.com : https://www.robicomp.com/penjelasan-tentang-pengertian-data-mart-dan-fungsinya.html

I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017

 


Komentar

Postingan populer dari blog ini

Bussiness Inteligence

CLOUD WAREHOUSING