168x Filetype PDF File size 0.87 MB Source: core.ac.uk
View metadata, citation and similar papers at core.ac.uk brought to you by CORE provided by STMIK GI MDP PERANCANGAN DATA WAREHOUSE DAN PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA KLASIFIKASI UNTUK DIAGNOSIS PASIEN DI UNIT PATOLOGI ANATOMI RSMH PALEMBANG Patrio Arrohman (patrioleo@gmail.com), M. A. Taufik Hidayat (taufik1990@gmail.com), Abdul Rahman, S.Si, M.T.I. (arahman@stmik-mdp.net) Jurusan Teknik Informatika STMIK MDP Abstrak : Patologi Anatomi Palembang merupakan unit kesehatan milik Rumah Sakit Mohammad Hosein (RSMH) Palembang untuk mendiagnosis penyakit dan memperoleh informasi yang berguna secara klinis melalui pemeriksaan jaringan dan sel, yang umumnya melibatkan pemeriksaan visual kasar dan mikroskopik pada jaringan, dengan pengecatan khusus dan imunohistokimia yang dimanfaatkan untuk memvisualisasikan protein khusus dan zat lain pada dan di sekeliling sel. Perancangan data warehouse dan data mining adalah salah satu cara yang dapat digunakan untuk mendapatkan informasi dari data yang banyak tersebut. Salah satu informasinya adalah unit patologi anatomi tersebut dapat melihat dan mendapatkan informasi mengenai data pasien yang di dapat dengan menentukan tingkat penyakit yang diderita disemua umur diberbagai dimensi dengan manfaat dapat mempermudah dalam tingkat diagnosa yang diderita. Pengklasifikasian dapat dilakukan dengan menggunakan metode entropy. Dengan klasifikasi tersebut dapat melihat probability dan coefficient dari data pasien tersebut. Kata kunci : data mining, data warehouse, entropy, klasifikasi, informasi pasien, patologi anatomi, RSMH. Abstract : Anatomical Pathology Palembang is a hospital -owned health units Mohammad Hosein ( RSMH ) Palembang to diagnose disease and obtain clinically useful information through the examination of tissue and cells , which generally involves gross and microscopic visual examination of the tissues , with special staining and immunohistochemistry were used to visualize specific proteins and other substances in and around the cells . The design of data warehouse and data mining is one of the ways that can be used to get a lot of information from the data . One unit of information is the anatomic pathology can view and obtain information about the data in the patient can determine the level of illness in all age in different dimensions with benefits can facilitate the diagnosis rate suffered . The classification can be done by using the entropy method . With these classifications can see the probability and the coefficient of the patient data. Keywords : data mining, data warehouse, entropy, classification, patient information, anatomic pathology, RSMH. Hal - 1 1 PENDAHULUAN Data Warehouse dapat menyimpan data- data yang berasal dari sumber-sumber Patologi Anatomi bertujuan untuk yang terpisah ke dalam suatu format mendiagnosis penyakit dan memperoleh yang konsisten dan saling terintegrasi informasi yang berguna secara klinis melalui satu dengan lainnya. (Feri Sulianta dan pemeriksaan jaringan dan sel, yang umumnya Dominikus,2010). melibatkan pemeriksaan visual kasar dan mikroskopik pada jaringan, dengan c. Time Variant (Rentang Waktu) pengecatan khusus dan imunohistokimia yang dimanfaatkan untuk memvisualisasikan Data disimpan untuk memberikan protein khusus dan zat lain pada dan di informasi dari perspektif history sekeliling sel. Kini, Patologi Anatomi mulai (misalnya, 5-10 tahun terakhir). Setiap mempergunakan biologi molekuler untuk struktur kunci dalam data warehouse memperoleh informasi klinis tambahan dari berisi baik secara implisit maupun spesimen yang sama. eksplisit elemen waktu. 2 LANDASAN TEORI d. Nonvolatile 2.1 Data Data warehouse secara fisik memisahkan pengumpulan data dari aplikasi data yang Data merupakan bahan baku informasi ditemukan dalam operational dapat didefinisikan sebagai kelompok teratur environment. Di dalam pemisahan data simbol-simbol yang mewakili warehouse tidak memerlukan proses kuantitas,fakta,tindakan ,benda dan transaksi. sebagainya. Data terbentuk dari karakter, dapat berupa alphabet,angka maupun simbol 2.1.1 Dimensional Modelling khusus seperti *.$ dan/. Data disusun mulai dari bits, bytes ,fields, records, file dan Beberapa konsep pemodelan data database.(Supriyanto 2008,h.68) Warehouse pada dimensionality modeling yang dikenal pada umumnya, konsep-konsep 2.2 Data Warehouse tersebut adalah star schema, snowflake dan fact constellation schema. Data warehouse merupakan suatu sistem yang mengkonsolidasikan data secara 2.1.1.1 Star Schema (Skema Bintang) perodik dari sistem sistem yang ada (OLTP) kedalam suatu Penyimpanan dimensional. Skema bintang adalah sebuah Pada umunya data warehouse menyimpan logikal struktur yang mempunyai data histori beberapa tahun dan akan sebuah tabel fakta berisi data terbaru di dilakukan quey untuk keperluan business tengah, yang dikelilingi tabel dimensi inteligence atau aktifitas analisis lain nya yang berisi data referensi. (Sulianta F, Juju D, 2010,h.33). Karakteristik Data Warehouse menurut Inmon (buliding data warehouse, 2008,h.30) : a. Subject-oriented (Berorientasi Subjek) Data warehouse diorganisasikan ke dalam banyak subject yang utama seperti customer, product, dan sales..(Feri Sulianta dan Dominikus,2010). b. Integrated (Terintegrasi) Hal - 2 (Dimensional Modeling - In a Business Gambar 1: Star Schema Intelligence Environment 2006 ,h.58). 2.1.1.2 Snowflake Schema 2.1.2.2 Independent Data Mart Architecture Menurut Connolly dan Begg (2008:1229), snowflake schema adalah sebuah Data mart merupakan data warehouse variasi dari star schema dimana tabel dimensi yang memiliki lingkup yang terbatas, dimana tidak memuat data yang didenormalisasi. data yang terdapat didalamnya diperoleh dari menseleksi dan meringkas data yang ada di dalam data warehouse. 2.1.2.3 Dependent Data Mart Architecture Pengembangan dependent data mart ini ditujukan untuk mengatasi keterbatasan – keterbatasan yang dimiliki oleh independent data mart. 2.1.3 ETL (Extract, Transfrom, Load) a. Extraction Gambar 2: Snowflake Schema Extraction adalah pengambilan 2.1.1.3 Fact Constellation Schema data yang relevant atau berkaitan dari sumber data. Extract merupakan proses Fact constellation schema adalah skema yang pertama kali dilakukan dalam multi dimensional yang berisikan lebih dari pengisian data warehouse. satu tabel fakta yang saling berbagi tabel dimensi. b. Transformation Transformation mengubah format data dari sumber data operasional menjadi format data warehouse yang lebih spesifik. c. Loading Loading ke dalam data Gambar 3: Constellation Schema warehouse merupakan langkah terakhir dalam ETL. 2.1.2 Arsitektur Data Warehouse 2.1.4 Clasification 2.1.2.1 Enterprise Data Warehouse Klasifikasi dalam Data Mining Enterprise data warehouse adalah suatu merupakan metode pembelajaran data untuk model data warehouse yang mendukung memprediksi nilai dari sekelompok attribut. seluruh atau sebagaian besar dari kebutuhan Algoritma klasifikasi akan menghasilkan bisnis untuk penggunaan data warehouse sekumpulan aturan yang disebut rule yang yang sepenuhnya terintergrasi dan memiliki akan digunakan sebagai indicator untuk dapat tingkat akses data yang tinggi terhadap suatu memprediksi kelas dari data yang ingin departemen atau bagian dari bisnis diprediksi. Hal - 3 2.1.4.1 Algoritma Microsoft Decision Tree Menurut Sql server book online 2.1.8 CRISP-DM (Cross Industry Algoritma Microsoft decision tree adalah Standard Process for Data Mining) algoritma klasifikasi dan regresi yang disediakan oleh Microsoft SQL Server Dalam penerapan Data Mining Analysis Services untuk digunakan dalam digunakan metodologi CRISP-DM (Cross pemodelan prediktif dari kedua atribut diskrit Industry Standard Process for Data dan kontinu. Cara kerja Algoritma Microsoft Mining) (Olson & Delen, 2008). decision tree membangun sebuah model data 1. Business understanding mining dengan menciptakan serangkaian 2. Data understanding perpecahan di diagram pohon. 3. Data preparation 4. Modeling 5. Evaluation 2.1.5 Microsoft SQL Business Intelligence 6. Deployment Development Studio (BIDS) Business intelligence adalah istilah 3 PERANCANGAN DATA WAREHOUSE sebuah payung yang menggabungkan DAN DATA MINING arsitektur, tools, database, analytical tools, aplikasi dan metodologi. Tujuan utama 3.1 Profil Singkat Unit Patologi Anatomi Business intelligence adalah dapat mengakses RSMH Palembang data secara interaktif (kadang – kadang dalam real time), untuk dapatmemanipulasi data dan Unit Patologi Anatomi RSMH memberikan manager bisnis dan analisis melayani pemeriksaan jaringan/sel untuk kemampuan untuk mengadakan analisa yang diagnosis penyakit non neoplasma yang sesuai. didukung dengan peralatan lengkap seperti : 2.1.6 Microsoft SQL Server Microtom, Tissu Embedding, Autoclave, Tissu Processor, Microscope, Microwave, SQL adalah bahasa yang digunakan Centrifuge. untuk mengakses basis data yang tergolong 3.2 Perancangan Data Warehouse relasional, tidak terbatas hanya untuk dapat mengambil data (query), tetapi juga dapat Pada Proses pembuatan data digunakan untuk menciptakan tabel, warehouse pada Unit Patologi Anatomi menghapus data pada tabel, mengganti data RSMH Palembang, Metode yang digunakan pada tabel, dan berbagai operasonal lainnya. menggunakan metodologi sembilan tahapan (nine-step methodology) atau biasa disebut 2.1.7 Nine-step Methodology dengan metode Ralph Kimbal. Nine-step Methodology (Connolly dan 3.3 Data Warehouse Server Begg, 2005, h.1187). Kesembilan tahap itu yaitu: Merupakan tingkatan paling bawah 1. Pemilihan Proses pada arsitektural data warehouse. Pada 2. Pemilihan Grain tingkatan ini dilakukan proses pembentukan 3. Identifikasi dan penyesuaian data warehouse Patologi, dimulai dari proses 4. Pemilihan Fakta pengumpulan data, cleaning data, ekstraksi 5. Penyimpanan pre-calculation di tabel data, transformasi dan loading data ke tabel 6. Memastikan tabel dimensi dimensi dan fakta pada data warehouse 7. Pemilihan durasi database Zhulian. Berikut langkah – langkah proses 8. Melacak perubahan dari dimensi ETL(Extract, Transform, Loading) yang secara perlahan dilakukan. 9. Penentuan prioritas dan model query Hal - 4
no reviews yet
Please Login to review.