Minggu, Januari 27, 2013

Tugas Kapita Selekta_Didik Permana Putra_1103101_TI 3C

TUGAS KAPITA SELEKTA
DATA MART, DATA WAREHOUSE, DATA MINING, OLAP, MOLAP, ROLAP



Nama        : Didik Permana Putra
NPM         : 1103101
Kelas         : 3C
Jurusan      : Teknik Informatika



Data Mart

Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi. Contoh umum data mart adalah untuk departemen penjualan, departemen persediaan dan pengiriman, departemen keuangan, manajemen tingkat atas, dan seterusnya. Data mart juga dapat digunakan untuk gudang data segmen data untuk mencerminkan bisnis secara geografis terletak di mana masing-masing daerah relatif otonom. Sebagai contoh, sebuah organisasi layanan yang besar mungkin memperlakukan pusat operasi regional sebagai unit usaha perorangan, masing-masing dengan data mart sendiri yang memberikan kontribusi untuk gudang data master. Data mart harus dirancang dari perspektif bahwa mereka adalah komponen dari data warehouse terlepas dari fungsi masing-masing atau konstruksi. Ini menyediakan konsistensi dan kegunaan dari informasi seluruh organisasi.

- Beberapa contoh produk data mart adalah sebagai berikut:
   Ø SmartMart (IBM).
   Ø       Visual Warehouse (IBM).
   Ø        PowerMart (Informatika).

- Karakteristik Data Mart:
Ø Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
Ø  Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
Ø  Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami.
Ø  Data mart bisa bersifat dependent atau independent.
    v  Kubus
 v  Aggregation

Keuntungan dan Kerugian menggunakan data mart:
·          - Keuntungan
      Data mart dapat meningkatkan waktu respon pengguna akhir, karena berisi data mentah yang memungkinkan sistem komputer untuk fokus pada satu tugas, sehingga meningkatkan kinerja. Berbeda dengan sistem OLTP, data mart juga dapat menyimpan data historis yang memungkinkan pengguna untuk menganalisis kecenderungan data. Selain itu, data mart tidak begitu mahal dan kompleks sebagai data gudang untuk setup dan melaksanakan karena masalah teknis tidak begitu sulit untuk diselesaikan.
·        
             - Kerugian
            Mereka memiliki nilai yang terbatas karena mereka tidak dapat melihat organisasi secara keseluruhan dan pelaporan dan analisis potensi terbatas.

      
      Data Warehouse
      
     Data warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. Sumber data pada data warehouse berasal dari berbagai macam format, software, platform dan jaringan yang beda. Data tersebut adalah hasil dari proses transaksi perusahan atau organisasi sehari.hari. Karena berasal dari sumber yang berbeda beda tadi, maka data pada data warehouse harus tersimpan dalam sebuah format yang baku. Data warehouse juga merupakan salah satu sistem pendukung keputusan, yaitu dengan menyimpan data dari berbagai sumber, mengorganisasikannya dan dianalisa oleh para pengambil kebijakan. Akan tetapi data warehouse tidak dapat memberikan keputusan secara langsung. Namun ia dapat memberikan informasi yang dapat membuat user menjadi lebih paham dalam membuat kebijakan strategis.

- Karakteristik umum yang dimiliki data warehouse adalah:
 Ø Data terintegrasi dari berbagai sumber yang berasal dari proses transaksional (OLTP).
 Ø Data dibuat konsisten.
 Ø Merupakan agregate data atau kesimpulan data, bukan data yang terperinci.
 Ø  Data bertahan lebih lama.
 Ø Data tersimpan dalam format yang tepat sehingga proses query dan analisa dapat dilakukan dengan cepat.
 Ø  Data bersifat read only.

Kelebihan dan Kekurangan Data Warehouse:
·           - Kelebihan
Ø  Data terorganisir dengan baik untuk query analisis dan sebagai bahan yang baik untuk proses transaksi.
Ø  Perbedaan struktur data yang banyak macamnya dari sumber yang berbeda dapat diatasi.
Ø  Memiliki aturan transformasi untuk memvalidasi dan menkonsolidasi data dari OLTP ke data warehouse.
Ø  Masalah keamanan dan kinerja dapat dipecahkan tanpa perlu mengubah sistem produksi.
Ø  Memiliki model data yang banyak macamnya, dan tidak tergantung dari format data awal atau sumbernya, sehingga memudahkan dalam menciptakan laporan.
Ø  Proses transformasi atau perpindahan dapat di monitoring. jika terjadi kesalahan dapat diarahkan atau diluruskan.
Ø  Informasi yang disimpan dalam data warehouse, jadi ketika OLTP data sumber nya hilang. informasi yang diolah tetap terjaga dalam suatu data warehouse.
Ø  Data warehose tidak memperlambat kerja operasional transaksi.
Ø  Dapat menyediakan laporan yang bermacam-macam.
·         
    - Kekurangan
Ø  Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
Ø Data perlu diekstrak, diubah (ETL) dan di load ke data warehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
Ø  Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah data warehouse.
Ø  Data warehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.


      Data Mining

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar. Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan data mining adalah bahwa subset atau set data yang dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali, selama konstruksi desain eksperimental. Beberapa teknik yang sering disebut-sebut dalam literatur Data Mining dalam penerapannya antara lain: clustering, classification, association rule mining, neural network, genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap Data Mining adalah perkembangan teknik-teknik Data Mining untuk aplikasi pada database skala besar. Sebelum populernya Data Mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.

   - Fungsi Data Mining:
- Fungsi Deskriptif: Fungsi Data Mining yang memberikan deskriptif atau gambaran dari informasi data yang tersedia. Contoh: Produk yang sering dibeli.
- Fungsi Prediktif: Fungsi Data Mining yang memberikan prediksi atau target pencapaian dari informasi sumber data. Contoh: Prospek kerja presiden untuk 3 tahun kedepan.

- Perbedaan antara Data Warehouse dengan Data Mining: 
Ø  Teknologi Data Warehouse digunakan untuk proses analisa pada Data Mining.
Ø  Data Mining lebih fokus kepada data analis.


- Data Mining terdiri atas beberapa ilmu yaitu:
Ø  Database
Ø  Statistik
Ø  Permodelan Matematika 

Kelebihan Data Mining:
Ø  Kemampuan dalam mengolah data dalam jumlah yang besar.
Ø  Pencarian data secara otomatis.

Kekurangan Data Mining:
Ø  Kendala Database (Garbage in garbage out).
Ø  Tidak bisa melakukan analisa sendiri.


     OLAP
  
   OLAP (Online Analitycal Processing) adalah teknologi yang memproses data di dalam database dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query dan analisis yang kompleks. Data yang disajikan biasanya merupakan suatu fungsi agregasi seperti summary, max, min, average dan lain-lain.

- Karakteristik dari OLAP, yaitu:
Ø  Mengijinkan user melihat data dari sudut pandang logical dan multidimensional pada data warehouse.
Ø  Memfasilitasi query yang komplek dan analisa bagi user.
Ø  Mengijinkan user melakukan Drill down untuk menampilkan data pada level yang lebih detil atau roll up untuk agregasi dari satu dimensi atau beberapa dimensi.
Ø  Menyediakan proses kalkulasi dan perbandingan data.
Ø  Menampilkan hasil dalam bentuk number termasuk dalam tabel dan grafik.

·  - Multidimensional Cube
Multidimensional cube mendukung beberapa feature seperti:
 Ø  Rotation atau Pivoting
Dengan kemampuan OLAP rotation atau pivoting, kita dapat melihat data dari berbagai sudut pandang (view point). kita dapat memutar-mutar sumbu pada cube sehingga kita memperoleh data yang kita inginkan sesuai dengan sudut pandang analisa yang kita perlukan.
Ø  Slicing dan Dicing
Pemilahan data dapat kita lakukan dengan proses slicing dan dicing. Slicing merupakan pemotongan sisi dari cube, artinya data yang kita potong berdasarkan kategori tertentu. Sedangkan dicing merupakan penyaringan subset data dari proses slicing.
Ø  Drill down dan consolidation
Agregasi data bisa kita lakukan dengan drill down dan consolidation. Penampilan data yang lebih detil dapat dilakukan dengan drill down dan sebaliknya untuk menyatukan data ke dalam hieraki yang lebih tinggi dapat dilakukan dengan consolidation.
Ø  Dimentional Modelling
Terdapat dua pendekatan pada pemodelan data multidimensi, star schema dan snowflakes schema
Ø  Star Schema

- Karakteristik dari model ini adalah:
v  Pusat dari star disebut fact table.
v  Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi.
v  Setiap tabel dimensi berelasi langsung dengan fact table.
v  Tabel dimensi beisikan data tentang informasi atau waktu.
v  Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to many).
v  Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat diakatakan bahwa fact table memiliki kombinasi key dari tabel dimensi tersebut.


MOLAP

Multidimensional online analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data multidimensi. Struktur MOLAP ini tidak tersimpan pada data warehouse tapi tersimpan pada OLAP server. Sehingga performa query yang dihasilkan olehnya sangat  bagus. Model penyimpanan ini sesuai untuk database dengan ukuran kecil sampai sedang.

ROLAP

ROLAP (Relational online analitycal processing ) menggunakan tabel pada database relasional data warehouse untuk menyimpan detil data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan database, ia mengakses langsung pada tabel fact ketika membutuhkan jawaban sebuah query. Sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan ROLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.

Tidak ada komentar:

Posting Komentar