Pembangunan Infrastruktur BI

Hanya Blog UMY situs lain

Apa itu gudang Data?

Mari kita mulai dengan mendefinisikan apa itu gudang data. Sebuah gudang data adalah sistem yang mengambil dan mengkonsolidasikan data secara periodik dari sistem sumber ke dalam penyimpanan data dimensi ornormalized. Biasanya menyimpan tahun sejarah dan diminta untuk intelijen bisnis atau kegiatan analisis lainnya. Biasanya diperbarui dalam batch, tidak setiap saat terjadi transaksi di sistem sumber

Mari kita lihat diagram di Gambar 1-1, komponen demi komponen, dari kiri ke kanan. Sistem sumber adalah sistem OLTP yang berisi data yang ingin Anda muat ke dalam gudang data. Online Transaction Processing (OLTP) adalah sistem yang tujuan utamanya adalah untuk menangkap dan menyimpan transaksi bisnis. Data sistem sumber diperiksa dengan menggunakan data profiler untuk memahami karakteristik data. Data profiler adalah alat yang memiliki kemampuan untuk menganalisa data, seperti mencari tahu berapa banyak baris di setiap tabel, berapa banyak baris berisi nilai NULL, dan seterusnya.

Alat-alat seperti aplikasi analisis, data mining, scorecard, dashboard, alat pelaporan multidimensional, dan alat BI lainnya dapat mengambil data secara interaktif dari database multidimensi. Mereka mengambil data untuk menghasilkan berbagai fitur dan hasil pada layar front-end yang memungkinkan pengguna untuk Dapatkan pemahaman lebih dalam tentang bisnis mereka. Sebuah contoh
Aplikasi analitik adalah menganalisis penjualan menurut waktu, pelanggan, dan produk. Pengguna dapat menganalisis pendapatan dan biaya untuk bulan, wilayah, dan jenis produk tertentu. Tidak semua sistem data warehouse memiliki semua komponen yang ada sebelumnya. Bahkan jika sistem data warehouse tidak memiliki mekanisme kualitas data, database multidimensi, aplikasi analisis, aplikasi front-end, sistem kontrol atau sistem audit, metadata, atau stage, Anda tetap dapat menyebutnya sebagai sistem data warehouse. . Dalam bentuknya yang paling sederhana, mirip dengan Gambar 1-3.

Dalam kasus ini, sistem data warehouse hanya berisi sistem ETL dan penyimpanan data dimensi. Sistem sumber bukan bagian dari sistem data warehouse. Ini cukup banyak minimum. Jika Anda hanya mengeluarkan satu komponen lagi, Anda tidak dapat menyebutnya sebagai sistem data warehouse lagi. Pada Gambar 1-3, walaupun tidak ada aplikasi front-end seperti laporan atau aplikasi analitik, pengguna masih dapat melakukan query data di DDS dengan mengeluarkan pernyataan SQL secara langsung dengan menggunakan alat query database generik seperti yang di-host di SQL Server. Studio Manajemen Saya akan membahas arsitektur data warehouse di Bab 2.
mengambil data
Dalam kasus ini, sistem data warehouse hanya berisi sistem ETL dan penyimpanan data dimensi. Sistem sumber bukan bagian dari sistem data warehouse. Ini cukup banyak minimum. Jika Anda hanya mengeluarkan satu komponen lagi, Anda tidak dapat menyebutnya sebagai sistem data warehouse lagi. Pada Gambar 1-3, walaupun tidak ada aplikasi front-end seperti laporan atau aplikasi analitik, pengguna masih dapat melakukan query data di DDS dengan mengeluarkan pernyataan SQL secara langsung dengan menggunakan alat query database generik seperti yang di-host di SQL Server. Studio Manajemen Saya akan membahas arsitektur data warehouse di Bab 2.
mengkonsolidasikan data
Sebuah perusahaan dapat memiliki banyak sistem transaksional. Misalnya, bank dapat menggunakan 15 aplikasi berbeda untuk layanannya, satu untuk pemrosesan pinjaman, satu untuk layanan pelanggan, satu untuk teller / kasir, satu untuk ATM, satu untuk obligasi, satu untuk ISA, satu untuk tabungan, satu untuk perbankan swasta , satu untuk lantai perdagangan, satu untuk asuransi jiwa, satu untuk asuransi rumah, satu untuk hipotek, satu untuk call center, satu untuk rekening internal, dan satu lagi untuk deteksi kecurangan. Melakukan analisis profitabilitas pelanggan (virtualample) di berbagai aplikasi ini sangat sulit.
secara berkala
Pengambilan data dan konsolidasi tidak terjadi hanya sekali; Mereka terjadi berkali-kali dan biasanya secara berkala, seperti sehari-hari atau beberapa kali sehari. Jika pengambilan data hanya terjadi satu kali, maka datanya akan menjadi usang, dan setelah beberapa saat tidak akan berguna.
sumber data dimensi
penyimpanan data yang dinormalisasi
sejarah
pertanyaan
intelijen bisnis
kegiatan analitis lainnya
diperbarui dalam batch
definisi lainnya
gudang data hari ini
bisnis intelegen
pengelolaan hubungan pelanggan
data mining
pengelolaan data master
integrasi data pelanggan
tren masa depan dalam pergudangan data
Data tidak terstruktur
pencarian
arsitektur berorientasi layanan
gudang data real-time

Categories: Tak Berkategori

PROFIL AKU

raisul mukhlis


Popular Posts

Halo dunia!

Selamat datang di Blog UMY. Ini adalah tulisan pertama Anda. ...

BAB 1 - Pengenalan D

Apa itu gudang Data? Mari kita mulai dengan ...