본문 바로가기

연관규칙분석2

[Python] Apriori algorithm:; 연관규칙분석 (2) 안녕하세요. 우주신 입니다. 저번 포스팅에 이어서 연관규칙 알고리즘의 Apriori 알고리즘에 대해 글을 쓰겠습니다. 저번 포스팅에서 연관규칙분석 개념 및 Apriori 알고리즘에 대해 알아봤으니,이번에는 파이썬 코드를 보며 한번 더 복습해보자.(지난 포스트의 지식을 다 안다는 전제하에 코드만 설명) 내가 테스트한 트랜잭션 데이터베이스(Transaction Database)는 아래와 같은 양식이다.각 줄이 itemset을 구분하며, 1번 itemset은 7번 item과 14번 item으로 구성되어 있다고 보면 된다. Apriori 알고리즘은 아래와 같은 순서로 진행된다.1. 트랜잭션 데이터베이스를 스캔하면서 1-빈번항목집합을 구한다.2. k-빈번항목집합을 대상으로 (k+1)-빈번항목집합을 구한다.- Se.. 2018. 7. 23.
[Python] Apriori algorithm:: 연관규칙분석 (1) 안녕하세요. 우주신 입니다. 이번 포스팅에서는 연관규칙 알고리즘 중 가장 먼저 접하게 되는 Apriori 알고리즘에 대해 알아보겠습니다. Apriori 알고리즘은 빈발항목집합(frequent itemsets) 및 연관규칙분석을 위한 알고리즘이다. 먼저, 연관규칙분석이란 무엇인가?우리는 연관규칙 분석을 통해 서로 다른 두 아이템 집합이 얼만큼 빈번히 발생하는지(연관도)를 알 수 있다.경영학이라면 한번쯤은 들어 봤을만한 "맥주를 구매하는 고객들은 기저귀를 구매할 가능성이 높다." 예시도 연관규칙 탐색을 통해 도출된 결론으로 볼 수 있다. 연관규칙분석의 대표적인 알고리즘으로 ▷ Apriori algorithm ▷ FP-growth algorithm▷ DHP algorithm 등이 있는데, Apriori 알고리.. 2018. 7. 18.