TUGAS KAPITA SELEKTA
DATA MART, DATA WAREHOUSE, DATA MINING, OLAP, MOLAP, ROLAP
Nama : Didik Permana Putra
NPM : 1103101
Kelas : 3C
Jurusan : Teknik Informatika
Data Mart
Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi. Contoh umum data mart adalah untuk departemen penjualan, departemen persediaan dan pengiriman, departemen keuangan, manajemen tingkat atas, dan seterusnya. Data mart juga dapat digunakan untuk gudang data segmen data untuk mencerminkan bisnis secara geografis terletak di mana masing-masing daerah relatif otonom. Sebagai contoh, sebuah organisasi layanan yang besar mungkin memperlakukan pusat operasi regional sebagai unit usaha perorangan, masing-masing dengan data mart sendiri yang memberikan kontribusi untuk gudang data master. Data mart harus dirancang dari perspektif bahwa mereka adalah komponen dari data warehouse terlepas dari fungsi masing-masing atau konstruksi. Ini menyediakan konsistensi dan kegunaan dari informasi seluruh organisasi.
- Beberapa contoh produk data mart adalah sebagai
berikut:
Ø SmartMart (IBM).
Ø Visual Warehouse (IBM).
Ø PowerMart (Informatika).
- Karakteristik Data Mart:
Ø Data mart memfokuskan
hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
Ø Data mart biasanya tidak
mengandung data operasional yang rinci seperti pada data warehouse.
Ø
Data mart hanya
mengandung sedikit informasi dibandingkan dengan data warehouse.
Data mart lebih mudah dipahami.
Ø
Data mart bisa bersifat
dependent atau independent.
v
Kubus
v
Aggregation
- Keuntungan dan Kerugian menggunakan data mart:
· - Keuntungan
Data mart dapat meningkatkan waktu respon pengguna akhir, karena berisi data
mentah yang memungkinkan sistem komputer untuk fokus pada satu tugas, sehingga
meningkatkan kinerja. Berbeda dengan sistem OLTP, data mart juga dapat
menyimpan data historis yang memungkinkan pengguna untuk menganalisis
kecenderungan data. Selain itu, data mart tidak begitu mahal dan kompleks
sebagai data gudang untuk setup dan melaksanakan karena masalah teknis tidak
begitu sulit untuk diselesaikan.
·
- Kerugian
Mereka memiliki nilai yang terbatas karena mereka tidak dapat melihat
organisasi secara keseluruhan dan pelaporan dan analisis potensi terbatas.
Data Warehouse
Data
warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan
menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi
bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. Sumber data pada
data warehouse berasal dari berbagai macam format, software, platform dan
jaringan yang beda. Data tersebut adalah hasil dari proses transaksi perusahan atau organisasi sehari.hari.
Karena berasal dari sumber yang berbeda beda tadi, maka data pada data warehouse
harus tersimpan dalam sebuah format yang baku. Data warehouse juga merupakan
salah satu sistem pendukung keputusan, yaitu dengan menyimpan data dari
berbagai sumber, mengorganisasikannya dan dianalisa oleh para pengambil
kebijakan. Akan tetapi data warehouse tidak dapat memberikan keputusan secara
langsung. Namun ia dapat memberikan informasi yang dapat membuat user menjadi
lebih paham dalam membuat kebijakan strategis.
- Karakteristik umum yang dimiliki data warehouse adalah:
Ø Data terintegrasi dari berbagai sumber yang berasal dari proses
transaksional (OLTP).
Ø Data dibuat konsisten.
Ø Merupakan agregate data atau kesimpulan data, bukan data yang terperinci.
Ø Data bertahan lebih lama.
Ø Data tersimpan dalam format yang tepat sehingga proses query dan analisa
dapat dilakukan dengan cepat.
Ø Data bersifat read only.
- Kelebihan dan Kekurangan Data Warehouse:
· - Kelebihan
Ø Data terorganisir dengan
baik untuk query analisis dan sebagai bahan yang baik untuk proses transaksi.Ø Perbedaan struktur data yang banyak macamnya dari sumber yang berbeda dapat diatasi.
Ø Memiliki aturan transformasi untuk memvalidasi dan menkonsolidasi data dari OLTP ke data warehouse.
Ø Masalah keamanan dan kinerja dapat dipecahkan tanpa perlu mengubah sistem produksi.
Ø Memiliki model data yang banyak macamnya, dan tidak tergantung dari format data awal atau sumbernya, sehingga memudahkan dalam menciptakan laporan.
Ø Proses transformasi atau perpindahan dapat di monitoring. jika terjadi kesalahan dapat diarahkan atau diluruskan.
Ø Informasi yang disimpan dalam data warehouse, jadi ketika OLTP data sumber nya hilang. informasi yang diolah tetap terjaga dalam suatu data warehouse.
Ø Data warehose tidak memperlambat kerja operasional transaksi.
Ø Dapat menyediakan laporan yang bermacam-macam.
·
- Kekurangan
Ø Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
Ø Data perlu diekstrak, diubah (ETL) dan di load ke data warehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
Ø Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah data warehouse.
Ø Data warehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.
Data Mining
- Kekurangan
Ø Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
Ø Data perlu diekstrak, diubah (ETL) dan di load ke data warehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
Ø Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah data warehouse.
Ø Data warehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.
Data Mining
Data Mining adalah
serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa
pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa
kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki
akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial
intelligent), machine learning, statistik dan database. Data mining adalah
proses menerapkan metode ini untuk data dengan maksud untuk mengungkap
pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk
penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting
untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam
berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan
penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan
pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang
penerbangan, data sensus dan supermarket scanner data untuk menghasilkan
laporan riset pasar. Alasan utama untuk menggunakan data mining adalah untuk membantu dalam
analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap
collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan data
mining adalah bahwa subset atau set data yang dianalisis mungkin tidak mewakili
seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis
tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi
masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan
pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia.
Dalam situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau
dihapus sama sekali, selama konstruksi desain eksperimental. Beberapa teknik
yang sering disebut-sebut dalam literatur Data Mining dalam penerapannya antara
lain: clustering, classification, association rule mining, neural network,
genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap Data Mining
adalah perkembangan teknik-teknik Data Mining untuk aplikasi pada database
skala besar. Sebelum populernya Data Mining, teknik-teknik tersebut hanya dapat
dipakai untuk data skala kecil saja.
- Fungsi Data Mining:
- Fungsi Deskriptif: Fungsi Data Mining yang memberikan deskriptif atau gambaran dari informasi data yang tersedia. Contoh: Produk yang sering dibeli.
- Fungsi Prediktif: Fungsi Data Mining yang memberikan prediksi atau target pencapaian dari informasi sumber data. Contoh: Prospek kerja presiden untuk 3 tahun kedepan.
- Perbedaan antara Data Warehouse dengan Data Mining:
Ø Teknologi Data Warehouse digunakan untuk proses analisa pada Data Mining.
Ø Data Mining lebih fokus kepada data analis.
- Data Mining terdiri atas beberapa ilmu yaitu:
Ø Database
Ø Statistik
Ø Permodelan Matematika
- Kelebihan Data Mining:
Ø Kemampuan dalam mengolah data dalam jumlah yang besar.
Ø Pencarian data secara otomatis.
- Kekurangan Data Mining:
Ø Kendala Database (Garbage in garbage out).
Ø Tidak bisa melakukan analisa sendiri.
OLAP
OLAP (Online Analitycal Processing) adalah teknologi yang memproses data di dalam database dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query dan analisis yang kompleks. Data yang disajikan biasanya merupakan suatu fungsi agregasi seperti summary, max, min, average dan lain-lain.
OLAP
OLAP (Online Analitycal Processing) adalah teknologi yang memproses data di dalam database dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query dan analisis yang kompleks. Data yang disajikan biasanya merupakan suatu fungsi agregasi seperti summary, max, min, average dan lain-lain.
- Karakteristik dari OLAP, yaitu:
Ø Mengijinkan user melihat data dari sudut pandang logical dan
multidimensional pada data warehouse.
Ø Memfasilitasi query yang komplek dan analisa bagi user.
Ø Mengijinkan user melakukan Drill down untuk menampilkan data pada level
yang lebih detil atau roll up untuk agregasi dari satu dimensi atau beberapa
dimensi.
Ø Menyediakan proses kalkulasi dan perbandingan data.
Ø Menampilkan hasil dalam bentuk number termasuk dalam tabel dan grafik.
· - Multidimensional Cube
Multidimensional cube
mendukung beberapa feature seperti:
Ø
Rotation atau Pivoting
Dengan kemampuan OLAP rotation atau pivoting, kita dapat melihat data dari berbagai sudut pandang (view point).
kita dapat memutar-mutar sumbu pada cube sehingga kita
memperoleh data yang kita inginkan sesuai dengan sudut pandang analisa yang
kita perlukan.
Ø
Slicing dan Dicing
Pemilahan data dapat kita lakukan dengan proses slicing dan dicing. Slicing merupakan pemotongan sisi dari cube, artinya data yang
kita potong berdasarkan kategori tertentu. Sedangkan dicing merupakan
penyaringan subset data dari proses slicing.
Ø Drill down dan consolidation
Agregasi data bisa kita
lakukan dengan drill down dan consolidation. Penampilan data yang lebih detil
dapat dilakukan dengan drill down dan sebaliknya untuk menyatukan data ke dalam
hieraki yang lebih tinggi dapat dilakukan dengan consolidation.
Ø Dimentional Modelling
Terdapat dua pendekatan
pada pemodelan data multidimensi, star schema dan snowflakes schema
Ø Star Schema
- Karakteristik dari model
ini adalah:
v Pusat dari star disebut fact table.
v Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal
dari tabel dimensi.
v Setiap tabel dimensi berelasi langsung dengan fact table.
v Tabel dimensi beisikan data tentang informasi atau waktu.
v Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to
many).
v Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat
diakatakan bahwa fact table memiliki kombinasi key dari tabel dimensi tersebut.
MOLAP
Multidimensional online
analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data
multidimensi. Struktur MOLAP ini tidak tersimpan pada data warehouse tapi
tersimpan pada OLAP server. Sehingga performa query yang dihasilkan olehnya
sangat bagus. Model penyimpanan ini sesuai untuk database dengan
ukuran kecil sampai sedang.
ROLAP
ROLAP (Relational online analitycal processing )
menggunakan tabel pada database relasional data warehouse untuk menyimpan detil
data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan
database, ia mengakses langsung pada tabel fact ketika membutuhkan jawaban
sebuah query. Sehingga query pada ROLAP
mempunyai response time yang lebih lambat dibandingkan ROLAP
maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar
dan jarang dilakukannya proses query. Misalkan, data histori dalam
jumlah besar dari beberapa tahun yang sebelumnya.
Tidak ada komentar:
Posting Komentar