Association Rule (Algoritma A Priori)
May 20, 2013
Add Comment
Algoritma A Priori termasuk jenis aturan asosiasi pada data mining. Selain a priori, yang termasuk pada golongan ini adalah metode generalized rule induction dan algoritma hash based. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis atau market basket analysis.
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap:
a. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut:
b. Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A ->B
Nilai confidence dari aturan A ->B diperoleh dari rumus berikut:
Contoh, ada transaksi seperti yang dilihat di bawah ini:
Transaksi | Item yang dibeli |
1 | D, E, C |
2 | C, A |
3 | C, B, D |
4 | A, C, E, D |
5 | E, D |
6 | E, C, B |
7 | B, D, A |
1. Pisahkan masing-masing item yang dibeli
Item yang dibeli |
A |
B |
C |
D |
E |
2. Kemudian Buat Tabel seperti di bawah ini dan hitung jumlahnya:
Transaksi | A | B | C | D | E |
1 | 0 | 0 | 1 | 1 | 1 |
2 | 1 | 0 | 1 | 0 | 0 |
3 | 0 | 1 | 1 | 1 | 0 |
4 | 1 | 0 | 1 | 1 | 1 |
5 | 0 | 0 | 0 | 1 | 1 |
6 | 0 | 1 | 1 | 0 | 1 |
7 | 1 | 1 | 0 | 1 | 0 |
∑ | 3 | 3 | 5 | 5 | 4 |
3.Tentukan Ф
Misalkan kita tentukan Ф = 3, maka kita dapat menentukan frekuen itemset. Dari tabel di atas diketahui total Ф untuk transaksi k = 1, semuanya lebih besardari Ф. Maka:
F1= {{A}, {B}, {C}, {D}, {E}}
Untuk k = 2 (2 unsur), diperlukan tabel untuk tiap-tiap pasang item. Himpunan yang mungkin terbentuk adalah: {A,B}, {A,C}, {A,D}, {A,E}, {B,C}, {B,D}, {B,E}, {C,D}, {C,E}, {D,E}.
Tabel-tabel untuk calon 2 item set
T | A | B | f | T | A | C | f | T | A | D | f | T | A | E | f | T | B | C | f | ||||
1 | 0 | 0 | s | 1 | 0 | 1 | s | 1 | 0 | 1 | s | 1 | 0 | 1 | s | 1 | 0 | 1 | S | ||||
2 | 1 | 0 | s | 2 | 1 | 1 | s | 2 | 1 | 0 | s | 2 | 1 | 0 | s | 2 | 0 | 1 | S | ||||
3 | 0 | 1 | s | 3 | 0 | 1 | s | 3 | 0 | 1 | s | 3 | 0 | 0 | s | 3 | 1 | 1 | P | ||||
4 | 1 | 0 | s | 4 | 1 | 1 | p | 4 | 1 | 1 | p | 4 | 1 | 1 | p | 4 | 0 | 1 | S | ||||
5 | 0 | 0 | s | 5 | 0 | 0 | s | 5 | 0 | 1 | s | 5 | 0 | 1 | s | 5 | 0 | 0 | S | ||||
6 | 0 | 1 | s | 6 | 0 | 1 | s | 6 | 0 | 0 | s | 6 | 0 | 1 | s | 6 | 1 | 1 | P | ||||
7 | 1 | 1 | p | 7 | 1 | 0 | s | 7 | 1 | 1 | p | 7 | 1 | 0 | s | 7 | 1 | 0 | S | ||||
∑ | 1 | ∑ | 1 | ∑ | 2 | ∑ | 1 | ∑ | 2 | ||||||||||||||
T | B | D | f | T | B | E | f | T | C | D | f | T | C | E | f | T | D | E | f | ||||
1 | 0 | 1 | s | 1 | 0 | 1 | s | 1 | 1 | 1 | p | 1 | 1 | 1 | p | 1 | 1 | 1 | p | ||||
2 | 0 | 0 | s | 2 | 0 | 0 | s | 2 | 1 | 0 | s | 2 | 1 | 0 | s | 2 | 0 | 0 | s | ||||
3 | 1 | 1 | p | 3 | 1 | 0 | s | 3 | 1 | 1 | p | 3 | 1 | 0 | s | 3 | 1 | 0 | s | ||||
4 | 0 | 1 | s | 4 | 0 | 1 | s | 4 | 1 | 1 | p | 4 | 1 | 1 | p | 4 | 1 | 1 | p | ||||
5 | 0 | 1 | s | 5 | 0 | 1 | s | 5 | 0 | 1 | s | 5 | 0 | 1 | s | 5 | 1 | 1 | p | ||||
6 | 1 | 0 | s | 6 | 1 | 1 | p | 6 | 1 | 0 | s | 6 | 1 | 1 | p | 6 | 0 | 1 | s | ||||
7 | 1 | 1 | p | 7 | 1 | 0 | s | 7 | 0 | 1 | s | 7 | 0 | 0 | s | 7 | 1 | 0 | s | ||||
∑ | 2 | ∑ | 1 | ∑ | 3 | ∑ | 3 | ∑ | 3 |
Dari tabel-tabel 2 unsur di atas, P artinya item-item yang dijual bersamaan, sedangkan S berarti tidak ada item yang dijual bersamaan atau tidak terjadi transaksi. Σ melambangkan jumlah Frekuensi item set.
Jumlah frekuensi item set harus lebih besar atau sama dengan jumlah Frekuensi item set (Σ >= Ф). Dari
tabel diatas, maka didapat:
F2 = {{C,D},{C,E},{D,E}}
Kombinasi dari itemset dalam F2, dapat kita gabungkan menjadi calon 3-itemset. Itemset-itemset yang dapat digabungkan adalah itemset-itemset yang memiliki kesamaan dalam k-1 item pertama.
Untuk k = 3 (3 unsur), himpunan yang mungkin terbentuk adalah: {C,D,E}
T | C | D | E | f |
1 | 1 | 1 | 1 | P |
2 | 1 | 0 | 0 | S |
3 | 1 | 1 | 0 | S |
4 | 1 | 1 | 1 | P |
5 | 0 | 1 | 1 | S |
6 | 1 | 0 | 1 | S |
7 | 0 | 1 | 0 | S |
∑ | 2 |
Dari tabel-tabel di atas, didapat F3= { }, karena tidak ada Σ >= Ф sehingga F4, F5, F6 dan F7 juga merupakan himpunan kosong.
4.Tentukan (ss-s) sebagai antecedent dan s sebagai consequent dari Fk yang telah didapat
Pada F2 didapat himpunan F2= {{C,D},{C,E},{D,E}}
Maka dapat disusun:
• Untuk {C,D}:
- Jika (ss-s) = C, Jika s = D, Maka →If buy C then buy D
- Jika (ss-s) = D, Jika s = C, Maka →If buy D then buy C
• Untuk {C,E}:
- Jika (ss-s) = C, Jika s = E, Maka →If buy C then buy E
- Jika (ss-s) = E, Jika s = C, Maka →If buy E then buy C
• Untuk {D,E}:
- Jika (ss-s) = D, Jika s = E, Maka →If buy D then buy E
- Jika (ss-s) = E, Jika s = D, Maka →If buy E then buy D
5. Dari langkah di atas, kita mendapatkan 6 rule yang dapat digunakan, yaitu:
- If buy C then buy D
- If buy D then buy C
- If buy C then buy E
- If buy E then buy C
- If buy D then buy E
- If buy E then buy D
6. Hitung support dan confidence
Sehingga didapat table sebagai berikut:
If antecedent then consequent | Support | Confidence |
If buy C then buy D | (3/7)x100%=42,86% | (3/5)x100%=60% |
If buy D then buy C | (3/7)x100%=42,86% | (3/5) x100%=60% |
If buy C then buy E | (3/7)x100%=42,86% | (3/5) x100%=60% |
If buy E then buy C | (3/7)x100%=42,86% | (3/4) x100%=75% |
If buy D then buy E | (3/7)x100%=42,86% | (3/5) x100%=60% |
If buy E then buy D | (3/7)x100%=42,86% | (3/4) x100%=75% |
7. Setelah di dapat support dan confidence untuk masing-masing kandidat, lakukan perkalian antara support dan confidence, dimana confidence-nya diambil 70% ke atas, sehingga di dapat tabel sbb:
If antecedent then consequent | Support | Confidence | Support x Confidence |
If buy E then buy C | 42,86% | 75% | 0.32145 |
If buy E then buy D | 42,86% | 75% | 0.32145 |
8. Setelah didapat hasil perkalian antara support dan confidence, pilihlah yang hasil perkaliannya paling besar. Hasil paling besar dari perkalian perkalian tersebut merupakan rule yang dipakai pada saat menjual. Karena hasil perkalian dari ke-2 penjualan di atas bernilai sama, maka semuanya bisa dijadikan rule.
- Jika membeli E maka akan membeli C dengan support 42,86% dan confidence 75%
- Jika membeli E maka akan membeli D dengan support 42,86% dan confidence 75%
0 Response to "Association Rule (Algoritma A Priori)"
Post a Comment