Selasa, 25 Oktober 2011

OLAP (On-Line Analytical Processing)

Konsep OLAP pertama diusulkan oleh E.F Codd, yang juga merupakan pencetus konsep basis data relasional. Pada basis data relasional data dimasukkan ke dalam tabel, sementara pada OLAP digunakan representasi array multidimensional.

Lalu apa pengertian OLAP?
OLAP merupakan suatu sistem atau teknologi yang dirancang untuk mendukung proses analisis kompleks dalam rangka mengungkapkan kecenderungan pasar dan faktor-faktor penting dalam bisnis.

Kategeori OLAP :
1. Multi-dimensional OLAP (MOLAP atau MD-OLAP)
2. Relational OLAP (ROLAP), disebut juga Multi-relational OLAP
3. Managed Query Environment (MQE), disebut juga Hybrid OLAP (HOLAP)

Keuntungan OLAP:
1. Meningkatkan produktifitas pemakai akhir bisnis, pengembang IT, dan keseluruhan organisasi. Pengawasan yang lebih dan akses tepat waktu terhadap informasi strategis dapat membuat pengambilan keputusan lebih efektif.
2.  Mengurangi “backlog” pengembangan aplikasi bagi staf IT dengan membuat pemakai akhir dapat merubah schema dan membangun model sendiri.
3. Penyimpanan pengawasan organisasi melalui integritas data koorporasi.
4. Sebagai aplikasi OLAP tergantung pada data warehouse dan sistemOLTP untuk memperbaharui sumber tingkatan data mereka.
5. Mengurangi aktifitas query dan lalulintas jaringan pada system OLAP atau pada data warehouse.
6. Meningkatkan hasil dan keuntungan secara potensial dengan mengizinkan organisasi untuk merespon permintaan pasar lebih cepat.

Hubungan OLAP dengan Data Warehouse 



Multidimensional Model
Server basis data OLAP menggunakan struktur multi dimensi untuk menyimpan data dan hubungan antar data.  Struktur multidimensi data dapat digambarkan seperti kubus data, dan kubus didalam kubus data. Setiap sisi kubus adalah sebuah dimensi. Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran.

Sebagai contoh, penjualan buku dapat dilihat dari segi lokasi Buku, waktu, lokasi penjualan / toko dan sebagainya.

Jika digambarkan , maka akan terdapat tiga koordinat yaitu sumbu x mewakili buku, sumbu y mewakili dimensi waktu dan sumbu z untuk dimensi lokasi. Hal inilah yang menjadi perbedaan mendasar antara tabel relasional dan data multidimensi.

Spreadshet merupakan salah satu contoh dari data multidimensi ini. Fungsi yang ia sediakan seperti perhitungan sederhana dan dapat juga diubah pada dimensi tunggal.



Cube merupakan contoh data multidimensi selain spreadsheet. Dengan cube data menjadi lebih mudah untuk dimanipulasi. Setiap sumbu cube mewakili dimensi-dimensi. Terdapat measure yaitu nilai quantitative database yang ingin kita analisa. Biasanya measure berupa nilai penjualan, biaya, budget dan sejenisnya.

Measure dihitung berdasarkan dimensi-dimensi dari cube. Misalkan kita ingin meganalisa penjualan buku, total penjualan (sebagai measure) untuk suatu jenis buku tertentu (dimensi) pada lokasi / toko buku yang berbeda-beda (lokasi dapat dipilih sesuai dengan kebutuhan seperti negara, propinsi dll) pada suatu periode waktu tertentu (hari, minggu, bulan,tahun, kuartal).

Multidimensional cube mendukung beberapa feature seperti :

Rotation/Pivoting

Dengan kemampuan OLAP rotation/pivoting, kita dapat melihat data dari berbagai sudut pandang (view point). kita dapat memutar-mutar sumbu pada cube sehingga kita memperoleh data yang kita inginkan sesuai dengan sudut pandang analisa yang kita perlukan.

Slicing dan dicing

Pemilahan data dapat kita lakukan dengan proses slicing dan dicing. Slicing merupakan pemotongan sisi dari cube, artinya data yang kita potong berdasarkan kategori tertentu. Sedangkan dicing merupakan penyaringan subset data dari proses slicing.

Drill down dan consolidation

Agregasi data bisa kita lakukan dengan drill down dan consolidation. Penampilan data yang lebih detil dapat dilakukan dengan drill down dan sebaliknya untuk menyatukan data ke dalam hieraki yang lebih tinggi dapat dilakukan dengan consolidation.

Terdapat dua pendekatan pada pemodelan data multidimensi, star schema dan snowflakes schema.



Star Schema

Karakteristik:
• Pusat dari star disebut fact table
• Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi
• Setiap tabel dimensi berelasi langsung dengan fact table
• Tabel dimensi beisikan data tentang informasi atau waktu
• Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to many)
• Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat dikatakan bahwa fact table memiliki kombinasi key dari tabel dimensi tersebut

Snowflake schema

Model snowflake merupakan perluasan dari star dimana ia juga mempunyai satu atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama. Model snowflake ini hampir sama seperti teknik normalisasi


 Adapun keuntungan menggunakan model snowflake adalah :
• Pemakain space yang lebih sedikit
• Update dan maintenance yang lebih mudah
Sedangkan kerugian menggunakan model ini yaitu :
• Model lebih komplek dan rumit
• Proses query lebih lambat
• Performance yang kurang bagus


Sumber :
wsilfi.staff.gunadarma.ac.id/Downloads/files/4409/OLAP.pdf
nuraini.staff.gunadarma.ac.id/Downloads/files/26806/4-OLAP.ppt
http://www.gudangmateri.com/2010/04/data-multidimensi.html

Senin, 19 September 2011

Gudang Data

Apa itu Gudang Data atow dalam bahasa inggrisnya Data Warehouse?
Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam endukung proses pengambilan keputusan management.

Jadi menurut saya, DW merupakan suatu sistem komputer berorientasi subyek yang menyimpan dan menganalisis informasi dari berbagai sumber untuk digunakan dalam pengambilan keputusan.
  
Arsitektur GD?

Dari gambar tersebut dapat dikelompokkan menjadi 5 komponen utama, yaitu  
1. Operational Data
Sumber data dari Data Warehouse dapat di ambil dari mainframe, basis data relasional seperti misalnya Oracle. 
2. Load Manager
Melakukan seluruh operasi yang berhubungan dengan ekstrasi dan me-load data ke warehouse. 
3. Warehouse Manager
Melakukan seluruh operasi-operasi seperti menganalis untuk mendapatkan konsistensi, transformasi dan penggabungan data, penciptaan indeks dan view yang berhubungan dengan kegiatan manajemen data di dalam warehouse. 
4. Query Manager
Melakukan operasi-operasi yang berhubungan dengan manajemen user queries, termasuk mengarahkan query kepada tabel-tabel yang tepat dan menjadwalkan eksekusi dari query tersebut. Disebut sebagai komponen back-end.
5. End-User Access Tools 
Data warehouse  harus secara efisien mendukung secara khusus kebutuhan user serta secara rutin melakukan analisis. Performa yang baik dapat dicapai dengan merencanakan dahulu keperluan-keperluan untuk melakukan joins, summations dan laporan-laporan per periode dengan end-users.

Karakteristik GD?

Sumber :
http://docs.google.com/viewer?a=v&q=cache:vRZGyMVW2ioJ:myhut.org/public/datawarehouse.doc+data+warehouse&hl=id&gl=id&pid=bl&srcid=ADGEEShh0Yi7S_10gA9kUczB2v9M6YTsIvmk_JhYtAhURlCU9FAyoY0TK-Nug6YjiEUnRphl7TCMUyaS8rlgVFkx1Coxy1zfCbn2b295jzsUzMGc26NzYg43o8pNxiahEUxAWmxp1u91&sig=AHIEtbQtry9MwvRhgk4etdHYjVeB33qnmA 


http://www.scribd.com/doc/48316906/Materi-Pertemuan-2-Pendahuluan-Gudang-Data