Association rule : Apriori
Association rule : Apriori
ในทางธุรกิจ การรู้พฤติกรรมของลูกค้า หรือทำนายได้ว่า ลูกค้าซื้ออะไร แล้วจะซื้ออะไรต่อ โดยวิเคราะห์จากข้อมูลในอดีตที่เก็บไว้ ผลการวิเคราะห์สามารถนำมาประกอบการวางแผนเชิงกลยุทธ์ เพื่อเพิ่มยอดขาย หรือพัฒนากลยุทธ์การขายได้เป็นอย่างดี
1. กำหนดตำแหน่งวางสินค้า
2. จัดโปรโมชั่นกลุ่มสินค้า
3. ใช้บริหารสินค้าคงคลัง
เทคนิคการหากฎความสัมพันธ์ (Association rule) ด้วยวิธี Apriori พัฒนาโดย Agrawal และ Srikant ในปี 1994 หาอ่านได้จากหนังสือ An Introduction to Data Mining Techniques โดย Ph.D. Eakasit Pacharawongsakda
นิยามศัพท์ 1. กฎความสัมพันธ์ที่ x มีตัวอย่างการเขียน คือ ลูกค้าซื้อกาแฟ => ลูกค้าซื้อซาลาเปา
2. ส่วนซ้าย หรือส่วนก่อน เรียกว่า Left Hand Side = LHS
3. ส่วนขวา หรือส่วนหลัง เรียกว่า Right Hand Side = RHS
4. สมการค่าสนับสนุน คือ จำนวนทรานแซคชั่นที่ปรากฎ / จำนวนทรานแซคชั่นทั้งหมด (ใช้ได้ทั้งค่าร้อยละ [25%] และผลหาร [1/4])
5. สมการค่าความมั่นใจ (Confidence) คือ confidence (L => R) = support( L , R) / support( L )
6. สมการค่าลิฟท์ (Lift) คือ lift (L => R) = support( L , R) / support( L ) x support( R )
7. ค่าสนับสนุน (Support) คือ จำนวนครั้งที่ลูกค้าซื้อสินค้า
8. ค่าความมั่นใจ (Confidence) คือ ค่าแสดงความเชื่อมั่นของกฎความสัมพันธ์ ถ้าเท่ากับ 1 (100%) คือ ซื้ออย่างแรก ต้องซื้ออย่างหลังเสมอ
9. ค่าลิฟท์ (Lift) คือ ค่าบ่งชี้ว่าการเกิดรูปแบบ LHS และ RHS มีความสัมพันธ์เพียงใด ถ้าค่ามากกว่า 1 (100%) มากเท่าใด ก็แสดงว่าสัมพันธ์กันมากเช่นกัน
10. ค่า minimum support คือ ค่าร้อยละต่ำสุดที่ยอมรับได้ เช่น ไม่น้อยกว่า 50%
+ บทที่ 2 ของ Data Mining โดย ดร.เอกสิทธิ์ พัชรวงศ์ศักดา
+ PDF : การทำเหมืองข้อมูล โดย วิวัฒน์ ชินนาทศิริกุล
ตัวอย่างรายการทรานแซคชั่นสินค้า โดย วิวัฒน์ ชินนาทศิริกุล
ลำดับการซื้อรายการทรานแซคชั่น
1กาแฟร้อน ซาลาเปา ขนมปัง
2กาแฟร้อน ซาลาเปา
3กาแฟร้อน น้ำดื่ม ผ้าเย็น
4ผ้าเย็น น้ำดื่ม
5ผ้าเย็น ขนมปัง
6กาแฟร้อน น้ำดื่ม ขนมปัง ซาลาเปา

+ PDF : การทำเหมืองข้อมูล โดย วิวัฒน์ ชินนาทศิริกุล
ตัวอย่างรายการทรานแซคชั่นสินค้า โดย ผศ.วิภาวรรณ บัวทอง
ลำดับการซื้อรายการทรานแซคชั่น
1Bread, Milk
2Bread, Diaper, Beer, Eggs
3Milk, Diaper, Beer, Coke
4Bread, Milk, Diaper, Beer
5Bread, Milk, Diaper, Coke

+ PDF : Association rule โดย ผศ.วิภาวรรณ บัวทอง
ตัวอย่างรายการทรานแซคชั่นสินค้า โดย ดร.เอกสิทธิ์ พัชรวงศ์ศักดา
Table 1 :
Transaction IDItems
1Apple, Cereal, Diapers
2Beer, Cereal, Eggs
3Apple, Beer, Cereal, Eggs
4Beer, Eggs

Table 2 :
ItemsTransaction IDSupport of item
1234
Apple10102/4 = 50%
Beer01113/4 = 75%
Cereal11103/4 = 75%
Diapers10001/4 = 25%
Eggs01113/4 = 75%

Table 3 :
ItemsetTransaction IDSupport of itemset
1234
{Apple, Beer}00101/4 = 25%
{Apple, Cereal}10102/4 = 50%
{Apple, Eggs}00101/4 = 25%
{Beer, Cereal}01102/4 = 50%
{Beer, Eggs}01113/4 = 75%
{Cereal, Eggs}01102/4 = 50%

Table 4 :
ItemsetTransaction IDSupport of itemset
1234
{Beer, Cereal, Eggs}01102/4 = 50%

Table 5 :
Frequent ItemsetSupportSize
{Apple}2/4 = 50%1
{Beer}3/4 = 75%1
{Cereal}3/4 = 75%1
{Eggs}3/4 = 75%1
{Apple, Cereal}2/4 = 50%2
{Beer, Cereal}2/4 = 50%2
{Beer, Eggs}3/4 = 75%2
{Cereal, Eggs}2/4 = 50%2
{Beer, Cereal, Eggs}2/4 = 50%3
Table 6 :

ขั้นตอนการหากฏความสัมพันธ์ (Association Rules)


ตารางนี้ สรุปความสัมพันธ์ด้วยค่า confidence และ lift
พบว่า
1. ถ้าซื้อ Apple จะซื้อ Cereal แน่นอน = 100%
2. ถ้าซื้อ Cereal มีโอกาสซื้อ Apple = 67%
3. Apple และ Cereal ค่า Lift มีความสัมพันธ์ 1.33 (มาก)
4. Beer และ Cereal ค่า Lift มีความสัมพันธ์ 0.89 (น้อย)

http://goo.gl/72BPC