Data warehouse (Darmawikarta, 2003) merupakan tempat penyimpanan untuk ringkasan
dari data historis yang diambil dari basis data-basis data yang tersebar di suatu organisasi.
Sejumlah besar data yang tersimpan dalam perusahaan membuat bagian administrasi harus dapat
mengekstrak informasi yang berguna, pelaporan, evaluasi. Data warehouse adalah sebuah sistem
yang mengambil dan mengkonsolidasikan data secara periodik dari sebuah sumber data ke
sebuah tempat penyimpanan data yang bersifat dimensional maupun relasional (Rainardi, 2008).
Data warehouse (Inmon, 1980) adalah data yang berorientasi obyek, terpadu, rentang waktu dan
tidak mengalami perubahan yang digunakan dalam strategi pengambilan keputusan.
Dapat dikatakan bahwa data warehouse mengumpulkan semua data perusahaan dalam
satu tempat agar dapat diperoleh pandangan yang lebih baik dengan waktu yang relatif cepat dari
suatu proses bisnis/kerja dan menjadi pendukung dalam pengambilan keputusan untuk
meningkatkan kinerja organisasi.
Data warehouse mempunyai empat karakteristik (Kamber, 2006) yaitu :
- Berorientasi subyek, terorganisasi pada subyek utama sesuai topik bisnis atau
berdasarkan subyek dari organisasi;
- Terintegrasi, data dibangun dengan mengintegrasikan berbagai sumber data;
- Time variant, dimensi waktu secara eksplisit termasuk dalam data, jadi model dan
perubahannya dapat diketahui setiap saat;
- Non volatile, data terpisah dari basis data operasional sehingga hanya memerlukan
pemuatan dan akses data.
Data tidak dapat berubah atau tetap.
Pembentukan sebuah data warehouse dimulai dengan tahapan praproses data (Kamber,
2006) yang akan mengubah data yang bersifat tidak jelas/rusak, data yang kekurangan nilai
atributnya, dan data yang tidak konsisten. Tahapan ini terdiri dari :
a. Integrasi data
Integrasi data adalah penggabungan data dari berbagai sumber penyimpanan data
untuk menjadi satu kesatuan data yang koheren.
b. Reduksi data
Teknik reduksi data diterapkan untuk memperoleh representasi tereduksi dari
sejumlah data yang berimplikasi pada volume yang jauh lebih kecil.
c. Pembersihan data
Proses ini merupakan tahapan pembersihan data, yaitu mengisi data yang hilang,
mengatasi data yang kotor dan rusak, mengidentifikasi atau membuang data pencilan,
memperbaiki data yang tidak konsisten.
d. Transformasi data
Transformasi data yaitu proses pengubahan data menjadi bentuk yang tepat. Proses
ini dilakukan agar kondisi data tetap konsisten dan dapat digunakan untuk proses
analisis.
Hubungan Bussiness Intelligence (BI) dan Data Warehouse
BI adalah seperangkat solusi sistem informasi yang dapat menuntun kepada percepatan
pengambilan keputusan dalam tingkat akurasi yang tinggi (Thia, 2011). BI seringkali disamakan
sebagaimana briefing books, report and query tools, dan sistem informasi eksekutif. BI
merupakan sistem pendukung pengambilan keputusan yang berbasiskan data-data (DJ Powers,
2002).
BI dapat didefinisikan sebagai kemampuan perusahaan untuk memahami dan
menggunakan informasi dalam rangka meningkatkan kinerja (Curko, 2008). Dapat disimpulkan
bahwa BI menjelaskan tentang suatu teknologi mengkonversi data berdasarkan sistem yang
berbasiskan data menghasilkan informasi yang tepat waktu untuk meningkatkan kualitas
pengambilan keputusan bisnis. Arsitektur BI dapat dilihat pada Gambar.
Gambar Arsitektur BI (Crowsol, 2012)
Arsitektur BI menurut Crowsoll, 2012 terdiri dari empat bagian yaitu :
1. Source Systems
Sebagian besar perusahaan telah membagikan data-data yang berkaitan dengan
departemen yang bersangkutan. Penjualan departemen biasanya memiliki metrik yang
berhubungan dengan penjualan dan kinerja. Sumber-sumber data yang berbeda
membentuk landscape BI bagi perusahaan.
2. Data Staging Area
Sumber data yang berbeda yang terdiri dari informasi bisnis perusahaan akhirnya
disimpan dalam gudang data. Ada sebuah proses yang disebut Extract Transform dan
Load (ETL) yang memfasilitasi sarana format data dari sumber yang berbeda sehingga
data dapat dimuat ke dalam struktur data warehouse.
3. Data Warehouse
Bentuk-bentuk berbagai data bisa disimpan dalam sebuah Data Warehouse. Data
Warehouse adalah struktur yang memfasilitasi pekerjaan utama intelijen bisnis -
pelaporan dan analisis. Bit data yang terstruktur dengan cara memfasilitasi matriks
fleksibel yang pada akhirnya dapat dikonfigurasi untuk menampilkan data dalam
berbagai dimensi dengan memanfaatkan konsep Online Analytical Processing (OLAP).
Konsep ini menyediakan struktur dikonfigurasi untuk menganalisis data.
4. User Interface
Analisis BI dapat terwujud dalam beberapa cara berbeda. Bisa diwujudkan dengan
aplikasi berbasis Web ataupun aplikasi custom yang menampilkan informasi.
Online Analitycal Processing (OLAP)
OLAP (Subhan, 2007) merupakan operasi basis data untuk mendapatkan dalam bentuk
kesimpulan dengan menggunakan aggregasi sebagai mekanisme utama. Mekanisme berupa
analisis dan pengambilan keputusan. Kelebihan OLAP adalah kemampuannya untuk
menciptakan struktur bisnis (wilayah penjualan, kategori produk, kalender fiskal, saluran partner, dan sebagainya) dan menggabungkannya dengan cara tertentu sehingga pengguna dapat dengan
cepat menjawab berbagai pertanyaan bisnis.
OLAP dapat menganalisis lebih dari yang
disediakan laporan biasa pada umumnya dan memungkinkan OLAP untuk mengembangkan apa
yang disediakan oleh data, mencari tren dan anomali (Bukhbinder, 2004).
Tanpa adanya tampilan multidimensi yang tersedia pada laporan, user harus mengambil
informasi dari berbagai tabel atau sumber lain dan melakukan analisis yang berorientasi obyek
seperti pada spreadsheet elektronik, atau melakukan query database yang kompleks. Respon
yang cepat dan kemampuan non-profesional untuk melakukan analisis tanpa keterlibatan
programmer adalah keuntungan dan kelebihan dari OLAP. Pada dasarnya dengan adanya OLAP
laporan-laporan spreadsheet standar menjadi ketinggalan jaman (Bukhbinder, 2004).
Dengan menggunakan teknologi OLAP, user dapat menganalisis data secara interaktif
dengan menggunakan fasilitas yang baik untuk membuat laporan, user diijinkan untuk merotasi
grid laporan, menelusuri data yang meringkasnya, melakukan filter dan melakukan sorting
terhadap data dan menghasilkan beberapa view/bentuk laporan hanya dengan manipulasi mouse.
Dengan demikian dapat diciptakan berbagai laporan yang kompleks dari satu tabel tanpa
memerlukan pengetahuan ekstra tentang pembuatan query dan bantuan seorang programmer.
Dengan pengujian data dari sudut yang berbeda, user akan dapat lebih memahami data sehingga
dapat mengambil keputusan yang efektif (Hermawan, 2005).
Operasi-operasi OLAP
Operasi-operasi yang terdapat pada OLAP antara lain :
1. Slicing dan Dicing
Merupakan operasi untuk melihat data sebagai visualisasi dari kubus. Dengan slicing dan
dicing pengguna dapat melihat data dari beberapa perspektif atau dimensi. Pengguna
dapat mengekstrak bagian dari data agregated dan dapat memeriksa dengan detail
berdasarkan dimensi-dimensi yang diinginkan (Kember, 2006). Konsep slicing dan
dicing berfungsi untuk mengambil potongan cubes berdasarkan nilai tertentu pada satu
atau beberapa dimensinya (Hendric, 2006).
Konsep ini dapat dilakukan dengan memberikan query atau perintah structured query
language (sql)yaitu :
Select ang, jenj, jenkel, sum (jum) as jumlah
from dwmhs where ang=”2000”
Group by ang, jenj, jenkel
Tampilan grafik hasil dari perintah sql diatas diberikan pada Gambar.
Gambar Grafik konsep Slicing dan Dicing (Hendric, 2006)
2. Roll up dan drill down
Merupakan operasi untuk melihat data global atau detail disepanjang level hirarki
dimensi. Roll up untuk melihat data secara global atau rangkuman (summary). Drill down
memandu pengguna untuk memperoleh data yang lebih detail (Kamber, 2006). Roll up
adalah proses merangkum atau meringkas nilai-nilai ukurannya, sedangkan proses drill
down adalah kebalikannya yaitu proses memilih dan menampilkan data rincian dalam satu atau beberapa dimensi (Hendric, 2006). Contoh konsep Roll up diberikan pada
Gambar.
Gambar Konsep Roll up (Hendric,2006)
Contoh Konsep Roll up pada Gambar merangkum jumlah mahasiswa pada angkatan
2000, 2001, 2002. Dapat dilakukan dengan perintah sql :
Select ang, sum (jum) as jumlah
from dwmhs
Group by ang
Adapun contoh konsep Drill Down:
Gambar Konsep Drill Down (Hendric,2006)
Contoh konsep Drill Down pada Gambar menampilkan informasi secara detail
mahasiswa pria yang berjumlah 11 orang pada angkatan 2000. Perintah sql nya adalah :
Select a.nim, a.nama from mastmhs a, dwmhs b where left(a.nim,2) = right(b.ang,2) and
substr(a.nim,3,2)=b.ps and
substr(a.nim,5,1)b.jenj and a.jenkel=b.jenkel
Ada dua cara untuk merealisasikan olap (Hermawan, 2005) yaitu :
1. Cara pertama, dengan mengimplementasikan sebuah OLAP server dimana perhitungan
eksekusi dilakukan pada komputer yang terpisah. OLAP server memerlukan invenstasi
tambahan dan pemeliharaan permanen karena sama sekali tidak memerlukan bantuan user
untuk melakukan kalkulasi. Dengan cara demikian OLAP server dimungkinkan untuk
menerima data dengan volume yang sangat besar.
2. Cara kedua adalah dengan mengimplementasikan sebuah OLAP Client yang akan
melakukan perhitungan di mesin user, OLAP Client tergolong murah dan tidak
membutuhkan maintenance. OLAP Client dapat dipergunakan bilamana kebutuhan untuk
melakukan manipulasi data relatif kecil.
Hubungan Datawarehouse dan OLAP
Kemampuan kita mengumpulkan dan menyimpan segala jenis data melampaui
kemampuan kita melakukan analisis, peringkasan, dan ekstraksi pengetahuan dari data. Untuk
membentuk analisis data diperlukan kakas otomatis yang dapat membantu melakukan ekstraksi
dan penemuan pengetahuan dari data.
Saat ini orang sudah sepakat bahwa informasi berkualitas tiggi adalah sangat penting dalam
dunia bisnis. OLAP (Online Analytical Processing) menggunakan informasi basisdata untuk
menyusun keputusan strategis. Basis data yang terlibat biasanya sangat besar dan seringkali tidak
memerlukan data terbaru. Aplikasi OLAP dicirikan dengan query yang kompleks, pembaruan
tidak sering dan mengakses sebagian besar basis data (Hermawan, 2005). Tujuan OLAP
menganalisis data adalah untuk digunakan di suatu pengambilan keputusan taktis dan strategis.
Terdapat dua isu teknis yang utama dalam analisis data, yaitu :
- Prosedur analisis yang dilakukan dan data yang mendukung prosedur itu.
- Metode-metode untuk memperoleh bagian besar data yang diperlukan secara efisien.
Basisdata OLAP biasanya disimpan di OLAP Server khusus atau di data warehouse yang
distrukturkan untuk mendukung OLAP Server. OLAP query sering begitu kompleks, memerlukan data yang sangat besar, yang bila dijalankan sekaligus di lingkungan OLTP akan
dapat menyebabkan melambatnya transaksi OLTP secara drastis.
Data warehouse adalah repository (arsip) informasi yang dikumpulkan dari banyak
sumber, disimpan dengan skema yang disatukan si satu situs tunggal. Begitu dikumpulkan, data
disimpan dalam kurun waktu yang lama.
Data warehouse menyediakan satu antarmuka
terkonsolidasi tunggal sehingga mempermudah pembuatan query yang mendukung pembuatan
keputusan. Dengan mengakses informasi dari data warehouse, pembuat keputusan dapat
menjamin bahwa Sistem pengolahan transaksi online tidak akan terganggu.
Data warehouse merupakan basisdata dimana data dikumpulkan dari banyak Sistem
untuk mendukung pelaporan dan pengambilan keputusan manajemen.
Basis data multidimensi
yang merupakan basisdata Sistem OLAP multidimensi memberi solusi yang berorientasi bisnis
untuk menjawab pertanyaan yang kompleks. Pendekatan ini mempunyai tingkat keberhasilan
yang tinggi ketika jawaban disusun dari matriks atau data kuantitatif.
Skema tabel yang sering digunakan adalah skema bintang. Skema bintang merupakan
skema yang digunakan OLAP, skema tabel ini membentuk struktur informasi multidimensi yang
kompatibel dengan kebutuhan bisnis. Skema bintang untuk menyelesaikan isu-isu di seputar
model ER yang dinormalkan untuk kebutuhan basisdata informasi bisnis.
Karakteristik utama
skema bintang adalah sebagai berikut :
- Pusat skema bintang adalah tabel fakta (fact table).
- Tabel fakta berisi indikator-indikator kinerja pokok.
- Indikator-indikator kinerja pokok adalah atribut-atribut dari tabel fakta.
- Obyek-obyek informasi dan waktu adalah kunci utama tabel fakta.
- Tabel-tabel yang ada disekeliling tabel fakta adalah tabel dimensi.
- Tabel dimensi berisi data mengenai obyek-obyek informasi atau waktu.
- Tabel fakta dan dimensi digabungkan dengan kunci banyak di tabel fakta.
- Skema bintang diimplementasikan menggunakan teknologi basisdata relasional.
Jika tabel-tabel dimensi dinormalisasi (sehingga dapat menjadi beberapa tabel), skema menjadi
lebih kompleks, disebut bercak salju (snowflake schema). Namun terdapat alasan tabel dimensi
jarang dinormalisasi, yaitu :
- Tabel dimensi telah begitu kecil dibandingkan tabel fakta sehingga ruang yang dihemat
melalui normalisasi tidak signifikan.
- Tabel dimensi jarang diperbaharui sehingga anomaly pembaruan tidak merupakan isu
utama. Bahkan dalam situasi eksekusi, analisis mendekomposisi relasi-relasi menjadi 3NF
atau BCNF dapat menuntun overhead untuk pengolahan query secara signifikan.
Desain Model Aplikasi
Desain model menggunakan pendekatan fungsional yang direpresentasikan menggunakan
Data Alur Diagram (DAD) untuk menunjukan secara fisik alur proses dan data pada program
yang dibuat. Diagram yang menggunakan notasi-notasi untuk menggambarkan arus data sistem
tersebut dengan DAD. Notasi-notasi DAD dilihatkan pada Tabel (Jogiyanto, 1999).
Tabel Notasi-Notasi DAD
Model Pengembangan Perangkat Lunak Waterfall
Menurut Roger S. Pressman, model pengembangan perangkat lunak meliputi model air
tejun (Waterfall Model), Prototipe (Prototyping), RAD (Rapid Application Development),
Evolusioner dan Formal. Dalam penelitian ini menggunakan model Waterfall, model ini dipilih
dengan alasan untuk membangun sistem ini dibutuhkan beberapa tahap yang berbeda yang merupakan sebuah pendekatan kepada perkembangan perangkat lunak yang sistematik dan
sekuensial mulai pada tingkat dan kemajuan sistem pada seluruh analysis, design, coding, dan
testing.
a. Analisis kebutuhan. Proses pencarian kebutuhan diintesifkan dan difokuskan pada
software. Untuk mengetahui sifat dari program yang akan dibuat, maka para programmer
harus mengerti tentang informasi dari software, misalnya fungsi yang dibutuhkan, user
interface.
b. Desain. Proses ini digunakan untuk mengubah kebutuhan-kebutuhan diatas menjadi
representasi ke dalam bentuk software sebelum coding dimulai. Design harus dapat
mengimplementasikan kebutuhan yang telah disebutkan pada tahap sebelumnya. Seperti
aktivitas sebelumnya, maka proses ini juga harus didokumentasikan sebagai konfigurasi dari
software.
c. Implementasi. Untuk dapat dimengerti oleh mesin, dalam hal ini komputer, maka desain
tadi harus diubah bentuknya menjadi bentuk yang dapat dimengerti oleh mesin, yaitu ke
dalam bahasa pemrograman melalui proses coding. Tahap ini merupakan implementasi dari
tahap design yang secara teknis nantinya dikerjakan oleh programmer.
d. Pengujian. Sesuatu yang dibuat haruslah diujicobakan. Demikian juga dengan software.
Semua fungsi-fungsi software harus diujicobakan, agar software bebas dari error, dan
hasilnya harus benar-benar sesuai dengan kebutuhan yang sudah didefinisikan sebelumnya.