Learning From Data
Data Warehouse
Data warehouse adalah suatu
paradigma baru dilingkungan pengambilan keputusan strategik. Data warehouse bukan
suatu produk tetapi suatu lingkungan dimana user dapat menemukan informasi strategic
[Poniah, 2001, h.14]. Data warehouse adalah kumpulan data-data logik
yang terpisah dengan database operasional dan merupakan suatu ringkasan.
Adapun karakteristik
dari data warehouse [Poniah, 2001,h.20-24] adalah sebagai berikut.
1. Berorientasi
subyek
Data warehouse adalah tempat
penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan
bagian dari suatu perusahaan. Contoh subyek pada perusahaan manufaktur adalah
penjualan, konsumen, inventori, daln lain sebagainya. Sumber: Poniah, 2001,h.21
Gambar 1. perbedaan data
warehouse dan database operasional Untuk lebih jelasnya mengenai perbedaan
antara database operasional dengan data warehouse bisa dilihat pada
tabel 1 dibawah ini.
2. Data
yang terintegrasi
Sumber
data yang ada dalam data warehouse tidak hanya berasal dari database
operasional (internal source) tetapi juga berasal dari data diluar sistem
(external source). Data pada sumber berbeda dapat di-encode dengan
cara yang berbeda. Sebagai contoh, data jenis kelamin dapat dienkode
sebagai 0
dan 1 di satu tempat dan ”m” dan ”f” di tempat lain.
3.
Nonvolatile
Data
dalam database operasional akan secara berkala atau periodic dipindahkan
kedalam data warehouse sesuai dengan jadwal yang sudah ditentukan. Misal
perhari, perminggu, perbulan, dan lain sebagainya. Sekali masuk ke dalam data
warehouse, data adalah read-only . Pada gambar 2
dibawah
ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus. Tetapi
pada database data warehouse hanya bisa dibaca.Sumber: Poniah, 2001,h.24
Gambar 2 Data warehouse adalah nonvolatile
4.
Time-Variant
Sistem operasional
mengandung data yang bernilai sekarang sedangkan data dalam data warehouse mengandung
data tidak hanya data terkini tetapi juga data history yang akan
digunakan dalam analisis dan pengambilan keputusan. Waktu adalah dimensi
penting yang harus didukung oleh semua data warehouse. Data untuk
analisis dari berbagai sumber berisi berbagai nilai waktu, misalkan harian,
mingguan, dan bulanan.
5.
Ringkas
Jika
diperlukan, data operasional dikumpulkan ke dalam ringkasanringkasan.
6.
Granularity
Pada
sistem operasional data dibuat secara real-time sehingga untuk mendapatkan
informasi langsung dilakukan proses query. Pada data warehouse
pada menganalisis harus memperhatikan level-of-detail misalkan perhari,
ringkasan perbulan, ringkasan per-tiga-bulan.
7. Tidak
ternormalisasi
Data di
dalam sebuah data warehouse biasanya tidak ternormalisasi dan
sangat
redundan. Dasar dari suatu data warehouse adalah suatu data yang besar
yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse
bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional
dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari
perusahaan lain, dan lain sebagainya. Data warehouse mengandung beberapa
elemen penting antara lain [Mallach, 2000,h.473]:
1. Sumber
data yang digunakan oleh data warehouse, database transaksional dan
sumber data eksternal.
2. Proses
ETL (Extraction, Transformation, Loading) dari sumber data kedatabase data
warehouse.
3.
Membuat suatu ringkasan atau summary terhadap data warehouse misalkan
dengan menggunakan fungsi agregat.
4.
Metadata.
Metadata
mengacu data tentang data. Metadata menguraikan struktur dan beberapa arti
tentang data, dengan demikian mendukung penggunaan efektif atau tidak efektif
dari data.
5.
Database data warehouse.
Database
ini berisi data yang detail dan ringkasan data dari data yang ada di dalam data
warehouse. Karena data warehouse tidak digunakan dalam proses
transaksi individu, maka databasenya tidak perlu
diorganisasikan
untuk akses transaksi dan untuk pengambilan data, melainkan dioptimisasikan
untuk pola akses yang berbeda di dalam analisis.
6. Query
Tools yaitu dengan OLAP (Online Analytical Processing ) dan data
mining.
Tool untuk query ini meliputi antarmuka pengguna akhir dalam mengajukan
pertanyaan kepada database, dimana proses ini disebut sebagai On-line
Analytical Processing (OLAP). Tool ini juga terdiri dari tool otomatis yang
menemukan pola-pola di dalam data, yang sering disebut sebagai data mining.
Data warehouse harus memiliki salah satu dari kedua tipe ini atau malah
kedua-duanya.
7. User.Pengguna yang
memanfaatkan data warehouse tersebut.