277x Filetype PDF File size 0.87 MB Source: core.ac.uk
View metadata, citation and similar papers at core.ac.uk brought to you by CORE
provided by STMIK GI MDP
PERANCANGAN DATA WAREHOUSE DAN PENERAPAN
DATA MINING MENGGUNAKAN ALGORITMA
KLASIFIKASI UNTUK DIAGNOSIS PASIEN
DI UNIT PATOLOGI ANATOMI
RSMH PALEMBANG
Patrio Arrohman (patrioleo@gmail.com),
M. A. Taufik Hidayat (taufik1990@gmail.com),
Abdul Rahman, S.Si, M.T.I. (arahman@stmik-mdp.net)
Jurusan Teknik Informatika
STMIK MDP
Abstrak : Patologi Anatomi Palembang merupakan unit kesehatan milik Rumah Sakit
Mohammad Hosein (RSMH) Palembang untuk mendiagnosis penyakit dan memperoleh
informasi yang berguna secara klinis melalui pemeriksaan jaringan dan sel, yang umumnya
melibatkan pemeriksaan visual kasar dan mikroskopik pada jaringan, dengan pengecatan khusus
dan imunohistokimia yang dimanfaatkan untuk memvisualisasikan protein khusus dan zat lain
pada dan di sekeliling sel. Perancangan data warehouse dan data mining adalah salah satu cara
yang dapat digunakan untuk mendapatkan informasi dari data yang banyak tersebut. Salah satu
informasinya adalah unit patologi anatomi tersebut dapat melihat dan mendapatkan informasi
mengenai data pasien yang di dapat dengan menentukan tingkat penyakit yang diderita disemua
umur diberbagai dimensi dengan manfaat dapat mempermudah dalam tingkat diagnosa yang
diderita. Pengklasifikasian dapat dilakukan dengan menggunakan metode entropy. Dengan
klasifikasi tersebut dapat melihat probability dan coefficient dari data pasien tersebut.
Kata kunci : data mining, data warehouse, entropy, klasifikasi, informasi pasien, patologi
anatomi, RSMH.
Abstract : Anatomical Pathology Palembang is a hospital -owned health units Mohammad
Hosein ( RSMH ) Palembang to diagnose disease and obtain clinically useful information
through the examination of tissue and cells , which generally involves gross and microscopic
visual examination of the tissues , with special staining and immunohistochemistry were used to
visualize specific proteins and other substances in and around the cells . The design of data
warehouse and data mining is one of the ways that can be used to get a lot of information from
the data . One unit of information is the anatomic pathology can view and obtain information
about the data in the patient can determine the level of illness in all age in different dimensions
with benefits can facilitate the diagnosis rate suffered . The classification can be done by using
the entropy method . With these classifications can see the probability and the coefficient of the
patient data.
Keywords : data mining, data warehouse, entropy, classification, patient information, anatomic
pathology, RSMH.
Hal - 1
1 PENDAHULUAN Data Warehouse dapat menyimpan data-
data yang berasal dari sumber-sumber
Patologi Anatomi bertujuan untuk yang terpisah ke dalam suatu format
mendiagnosis penyakit dan memperoleh yang konsisten dan saling terintegrasi
informasi yang berguna secara klinis melalui satu dengan lainnya. (Feri Sulianta dan
pemeriksaan jaringan dan sel, yang umumnya Dominikus,2010).
melibatkan pemeriksaan visual kasar dan
mikroskopik pada jaringan, dengan c. Time Variant (Rentang Waktu)
pengecatan khusus dan imunohistokimia yang
dimanfaatkan untuk memvisualisasikan Data disimpan untuk memberikan
protein khusus dan zat lain pada dan di informasi dari perspektif history
sekeliling sel. Kini, Patologi Anatomi mulai (misalnya, 5-10 tahun terakhir). Setiap
mempergunakan biologi molekuler untuk struktur kunci dalam data warehouse
memperoleh informasi klinis tambahan dari berisi baik secara implisit maupun
spesimen yang sama. eksplisit elemen waktu.
2 LANDASAN TEORI d. Nonvolatile
2.1 Data Data warehouse secara fisik memisahkan
pengumpulan data dari aplikasi data yang
Data merupakan bahan baku informasi ditemukan dalam operational
dapat didefinisikan sebagai kelompok teratur environment. Di dalam pemisahan data
simbol-simbol yang mewakili warehouse tidak memerlukan proses
kuantitas,fakta,tindakan ,benda dan transaksi.
sebagainya. Data terbentuk dari karakter,
dapat berupa alphabet,angka maupun simbol 2.1.1 Dimensional Modelling
khusus seperti *.$ dan/. Data disusun mulai
dari bits, bytes ,fields, records, file dan Beberapa konsep pemodelan data
database.(Supriyanto 2008,h.68) Warehouse pada dimensionality modeling
yang dikenal pada umumnya, konsep-konsep
2.2 Data Warehouse tersebut adalah star schema, snowflake dan
fact constellation schema.
Data warehouse merupakan suatu
sistem yang mengkonsolidasikan data secara 2.1.1.1 Star Schema (Skema Bintang)
perodik dari sistem sistem yang ada (OLTP)
kedalam suatu Penyimpanan dimensional. Skema bintang adalah sebuah
Pada umunya data warehouse menyimpan logikal struktur yang mempunyai
data histori beberapa tahun dan akan sebuah tabel fakta berisi data terbaru di
dilakukan quey untuk keperluan business tengah, yang dikelilingi tabel dimensi
inteligence atau aktifitas analisis lain nya yang berisi data referensi.
(Sulianta F, Juju D, 2010,h.33).
Karakteristik Data Warehouse menurut
Inmon (buliding data warehouse, 2008,h.30) :
a. Subject-oriented (Berorientasi Subjek)
Data warehouse diorganisasikan ke
dalam banyak subject yang utama seperti
customer, product, dan sales..(Feri
Sulianta dan Dominikus,2010).
b. Integrated (Terintegrasi)
Hal - 2
(Dimensional Modeling - In a Business
Gambar 1: Star Schema Intelligence Environment 2006 ,h.58).
2.1.1.2 Snowflake Schema 2.1.2.2 Independent Data Mart
Architecture
Menurut Connolly dan Begg
(2008:1229), snowflake schema adalah sebuah Data mart merupakan data warehouse
variasi dari star schema dimana tabel dimensi yang memiliki lingkup yang terbatas, dimana
tidak memuat data yang didenormalisasi. data yang terdapat didalamnya diperoleh dari
menseleksi dan meringkas data yang ada di
dalam data warehouse.
2.1.2.3 Dependent Data Mart Architecture
Pengembangan dependent data mart ini
ditujukan untuk mengatasi keterbatasan –
keterbatasan yang dimiliki oleh independent
data mart.
2.1.3 ETL (Extract, Transfrom, Load)
a. Extraction
Gambar 2: Snowflake Schema
Extraction adalah pengambilan
2.1.1.3 Fact Constellation Schema data yang relevant atau berkaitan dari
sumber data. Extract merupakan proses
Fact constellation schema adalah skema yang pertama kali dilakukan dalam
multi dimensional yang berisikan lebih dari pengisian data warehouse.
satu tabel fakta yang saling berbagi tabel
dimensi. b. Transformation
Transformation mengubah format
data dari sumber data operasional
menjadi format data warehouse yang
lebih spesifik.
c. Loading
Loading ke dalam data
Gambar 3: Constellation Schema warehouse merupakan langkah terakhir
dalam ETL.
2.1.2 Arsitektur Data Warehouse
2.1.4 Clasification
2.1.2.1 Enterprise Data Warehouse
Klasifikasi dalam Data Mining
Enterprise data warehouse adalah suatu merupakan metode pembelajaran data untuk
model data warehouse yang mendukung memprediksi nilai dari sekelompok attribut.
seluruh atau sebagaian besar dari kebutuhan Algoritma klasifikasi akan menghasilkan
bisnis untuk penggunaan data warehouse sekumpulan aturan yang disebut rule yang
yang sepenuhnya terintergrasi dan memiliki akan digunakan sebagai indicator untuk dapat
tingkat akses data yang tinggi terhadap suatu memprediksi kelas dari data yang ingin
departemen atau bagian dari bisnis diprediksi.
Hal - 3
2.1.4.1 Algoritma Microsoft Decision Tree
Menurut Sql server book online 2.1.8 CRISP-DM (Cross Industry
Algoritma Microsoft decision tree adalah Standard Process for Data Mining)
algoritma klasifikasi dan regresi yang
disediakan oleh Microsoft SQL Server Dalam penerapan Data Mining
Analysis Services untuk digunakan dalam digunakan metodologi CRISP-DM (Cross
pemodelan prediktif dari kedua atribut diskrit Industry Standard Process for Data
dan kontinu. Cara kerja Algoritma Microsoft Mining) (Olson & Delen, 2008).
decision tree membangun sebuah model data 1. Business understanding
mining dengan menciptakan serangkaian 2. Data understanding
perpecahan di diagram pohon. 3. Data preparation
4. Modeling
5. Evaluation
2.1.5 Microsoft SQL Business Intelligence 6. Deployment
Development Studio (BIDS)
Business intelligence adalah istilah 3 PERANCANGAN DATA WAREHOUSE
sebuah payung yang menggabungkan DAN DATA MINING
arsitektur, tools, database, analytical tools,
aplikasi dan metodologi. Tujuan utama 3.1 Profil Singkat Unit Patologi Anatomi
Business intelligence adalah dapat mengakses RSMH Palembang
data secara interaktif (kadang – kadang dalam
real time), untuk dapatmemanipulasi data dan Unit Patologi Anatomi RSMH
memberikan manager bisnis dan analisis melayani pemeriksaan jaringan/sel untuk
kemampuan untuk mengadakan analisa yang diagnosis penyakit non neoplasma yang
sesuai. didukung dengan peralatan lengkap seperti :
2.1.6 Microsoft SQL Server Microtom, Tissu Embedding, Autoclave, Tissu
Processor, Microscope, Microwave,
SQL adalah bahasa yang digunakan Centrifuge.
untuk mengakses basis data yang tergolong 3.2 Perancangan Data Warehouse
relasional, tidak terbatas hanya untuk dapat
mengambil data (query), tetapi juga dapat Pada Proses pembuatan data
digunakan untuk menciptakan tabel, warehouse pada Unit Patologi Anatomi
menghapus data pada tabel, mengganti data RSMH Palembang, Metode yang digunakan
pada tabel, dan berbagai operasonal lainnya. menggunakan metodologi sembilan tahapan
(nine-step methodology) atau biasa disebut
2.1.7 Nine-step Methodology dengan metode Ralph Kimbal.
Nine-step Methodology (Connolly dan 3.3 Data Warehouse Server
Begg, 2005, h.1187). Kesembilan tahap itu
yaitu: Merupakan tingkatan paling bawah
1. Pemilihan Proses pada arsitektural data warehouse. Pada
2. Pemilihan Grain tingkatan ini dilakukan proses pembentukan
3. Identifikasi dan penyesuaian data warehouse Patologi, dimulai dari proses
4. Pemilihan Fakta pengumpulan data, cleaning data, ekstraksi
5. Penyimpanan pre-calculation di tabel data, transformasi dan loading data ke tabel
6. Memastikan tabel dimensi dimensi dan fakta pada data warehouse
7. Pemilihan durasi database Zhulian. Berikut langkah – langkah proses
8. Melacak perubahan dari dimensi ETL(Extract, Transform, Loading) yang
secara perlahan dilakukan.
9. Penentuan prioritas dan model query
Hal - 4
no reviews yet
Please Login to review.