Pengembangan Infrastruktur BI (Sem 7)

Just another Blog UMY site

Introduction Data Warehouse

Posted by alief.setya.2011 Comments Off on Introduction Data Warehouse

1. Pengertian Data Warehouse

          Data warehouse adalah sebuah sistem yang menerima (Retrieve) dan menggabungkan (consolidates) data pada waktu tertentu (periodically) dari sistem sumber kedalam sebuah penyimpanan data dimensional dan normalized. Data Warehouse di desain untuk memfasilitasi pelaporan dan analis data menjadi bentuk informasi yang bernilai lebih. Secara sederhana, data warehouse dapat disebut sebagai koleksi dari data yang sangat banyak dan kompleks. Data warehouse berfokus pada penyimpanan data, dimana sumber data utama akan dibersihakan, di transformasikan, lalu di katalogkan, hingga bisa digunakan oleh manager dan profesional lain.
 1

2. Dimensional Data Store (DDS)

            Dimensional Data Store (DDS) adalah database yang menyimpan data dari data warehouse dalam format yang berbeda dari OLTP. Data disusun dalam format dimensi yang lebih cocok untuk analisis. DDS berisi data yang terintegrasi dari beberapa source system.

            Catatatn : DDS dapat di implementasikan secara fisik pada lebih dari satu database. dua atau lebih database dapat di implementasikan secara fisik dalam satu database. Contoh dari skema DDS adalah skema bintang yang ditunjukkan pada gambar 1.

10-22-2014 9-47-15 PM

3. Normalized Data Store (NDS)

            NDS merupakan satu atau lebih hubungan database dengan sedikit atau tidak ada data yang berlebih (data redundancy). Relasi database adalah database yang terdiri dari entity tables dengan hubungan parent-child diantara mereka. Normalization adalah proses menghapus data yang berlebih (data redundancy) dengan menerapkan peraturan normalization.
DDS merupakan format yang lebih baik daripada NDS untuk menyimpan data pada warehouse yang bertujuan untuk mencari/mengambil (query) dan menganalisa data.NDS merupakan format yang lebih baik untuk integrasi data dari berbagai sumber sistem. Ini dikarenakan hanya satu lokasi untuk update tanpa ada data yang berlebih (data redudancy) seperti DDS. NDS biasa digunakan unutk enterprise data warehouse.
Contoh NDS dapat dilihat pada gambar dibawah ini :

10-22-2014 9-47-47 PM

4. Multimedia Databases

Merupakan bentuk database dimana data disimpan di cell dan posisi masing-masing cell di definisikan oleh sejumlah variable yang disebut dimensions.

5. Bussiness Intelligence (BI)

              Merupakan kumpulan activity untuk mengerti situasi bisnis melalui performa berbagai tipe analisis pada data perusahaan sebaik di data eksternal dari third parties untuk membantu membuat strategi, taktik, dan keputusan operasional bisnis dan mengambil tindakan yang diperlukan untuk meningkatkan performa bisnis.

Menurut kedalaman analisis dan level kompleksitas : aktivitas BI dibagi menjadi 3 kategori :

      a. Reporting

Sebuah program yang menerima data dari data warehouse dan menampilka nya kepada user melalui layar atau kertas.

      b. OLAP (Online Analytical Processing)

Merupakan acvitiy analisis interaktif penyimpanan data transaksi bisnis di dimensi data warehouse untuk membuat taktik dan strategi keputusan bisnis.

      c. Data Mining

Merupakan proses menjelajah data untuk menemukan pola dan hubungan yang menggambarkan data dan untuk memprediksi nilai yang tak diketahui ataunilai masa depan dari data. Inti nya Data mining adalah kemampuan untuk memahami mengapa sesuatu terjadi di masa lampau ( descriptive analytics ) dan memprediksi apa yang akan terjadi di masa depan ( predictive analytics ).

 

6. Sejarah Data Warehouse

            Awal mula data warehouse berangkat dari tahun 80 an, dimana peneliti IBM Barry Devlin and Paul Murphy mengembangkan “business data warehouse”. Pada dasarnya bertujuan untuk menyediakan model arsitektur untuk perubahan data dari sistem operasional menuju sistem DSS. Beberapa hal penting berkisar sejarah data warehouse adalah :

  •  a. 1960s – General Mills dan Dartmouth College, mengembangkan istilah dimensions and facts.
  •  b. 1970s – ACNielsen dan IRI menyediakan imensional data marts untuk penjualan retail
  •  c. 1983 – Teradatamemperkenalkan sistem database yang khusus untuk DSS
  •  d. 1988 – Barry Devlin dan Paul Murphy mempublikasikan artikel An architecture for a business and information systems in yang memperkenalkan istilah  “business data warehouse”.
  •  e. 1990 – Red Brick Systems memperkenalkan Red Brick Warehouse, sistem manajemen database khusus untuk data warehousing.
  •  f. 1991 – Bill Inmon mempublikasikan buku Building the Data Warehouse.
  •  g. 1995 – The Data Warehousing Institute, organisasi profit yang mempromosikan data warehouse didirikan 1996 – Ralph Kimball mempublikasikan buku  The Data Warehouse Toolkit.
  •  h. 2000 – Daniel Linstedt mempublikasikan the Data Vault, yang memungkinkan audit data warehose.

Seiring dengan semakin meningkatnya kompetisi bisnis, tiap organisasi harus dapat melakukan tindakan bisnis yang tepat. Di masa yang lampau keputusan bisnis didasarkan pada intuisi pihak manajemen. Saat ini dibutuhkan informasi yang menunjang, tepat, cepat dan efisien dalam pengambilan keputusan. Informasi yang dibutuhkan berupa informasi yang telah tersumarisasi (summarized), dan terspesialisasi (spesialized) hasil dari analisa data operasional organisasi.

         Informasi yang dibutuhkan dapat hadir dalam bentuk laporan khusus, dan forecasting (peramalan) berdasarkan trend. Informasi dihasilkan oleh Business Intelligence atau sistem informasi eksekutif (Executive Support System) yang mendapatkan data dari data warehouse.

7. Tujuan Utama

            Tujuan utama dari pembuatan data warehouse adalah untuk menyatukan data yang beragam ke dalam sebuah tempat penyimpanan dimana pengguna dapat dengan mudah menjalankan query (pencarian data), menghasilkan laporan, dan melakukan analisis. Salah satu keuntungan yang diperoleh dari keberadaan data warehouse adalah dapat meningkatkan efektifitas pembuatan keputusan (Wajarsana, 2008).

8. Karakteristik

Menurut Bill Inmon, data yang disimpan didalam data warehouse ini memiliki empat karakteristik, yaitu :

  • a. Subject Oriented Data warehouse diorganisasikan pada subjek-subjek utama, seperti pelanggan, barang/produk, dan penjualan. Berfokus pada model dan analisis pada data untuk membuat keputusan, jadi bukan pada setiap proses transaksi atau bukan pada OLTP. Menghindari data yang tidak berguna dalam mengambil suatu keputusan.
  • b. Integrated Dibangun dengan menggabungkan/menyatukan data yang berbeda. relational databse, flat file, dan on-line transaction record. Menjamin konsistensi dalam penamaan, struktur pengkodean, dan struktur atribut diantara data satu sama lain.
  • c. Time Variant Data disimpan untuk menyediakan informasi dari perspektif historical, data yang tahun lalu/ 4-5 thn. Waktu adalah elemen kunci dari suatu data  warehouse/ pada saat pengcapture-an.
  • d. Non Volatile Setiap kali proses perubahan, data akan di tampung dalam tiap-tiap waktu. Jadi tidak di perbaharui terus menerus. Data warehouse tidak   memerlukan pemrosesan transaksi dan recovery. Hanya ada dua operasi initial loading of data dan access of data.

 

5. Kelebihan dan Kekurangan Data Warehouse

A. Kelebihan Data Warehouse :

  • a. Data terorganisir dengan baik untuk query analisis dan sebagai bahan yang baik untuk proses transaksi.
  • b. Perbedaan struktur data yang banyak macamnya dari sumber yang berbeda dapat di atasi
  • c. Memiliki aturan transformasi untuk memvalidasi dan menkonsolidasi data dari OLTP ke data warehouse.
  • d. Masalah keamanan dan kinerja dapat dipecahkan tanpa perlu mengubah sistem produksi.
  • e. Memiliki model data yang banyak macamnya, dan tidak tergantung dari format data awal/sumbernya, sehingga memudahkan dalam menciptakan laporan.
  • f. Proses transformasi/ perpindahan dapat di monitoring. jika terjadi kesalahan dapat di arahkan / di luruskan.
  • g. Informasi yang disimpan dalam data warehouse, jadi ketika OLTP data sumber nya hilang, informasi yang diolah tetap terjaga dalam suatu data warehouse.
  • h. Data warehose tidak memperlambat kerja operasional transaksi.
  • i. Dapat menyediakan laporan yang bermacam-macam

B. Kekurangan Data Warehouse :

  • a. Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
  • b. Data perlu di ekstrak, diubah (ETL) dan di load ke data warehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
  • c. Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah data warehouse.
  • d. Data warehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di data warehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.

 

Daftar Pustaka

 

Categories: Uncategorized

PROFIL AKU

alief.setya.2011


Popular Posts

Introduction Data Wa

1. Pengertian Data Warehouse           Data warehouse ...

Arsitektur Data Ware

Arsitektur Data Warehouse adalah sekumpulan aturan atau struktur yang menyediakan ...

Kebutuhan Fungsional

“Analisis Kebutuhan Sistem Untuk Pengguna” Pada tahap requirement gathering, kita harus ...

Pengembangan Metodol

Keberhasilan pengembangan perangkat lunak bergantung pada pengelolaan proyek perangkat  lunak secara keseluruhan. ...

Physical Database De

Physical data model Merupakan model yang menggunakan sejumlah tabel untuk ...