배움/자료

전자상거래 추천시스템에 관한 동향분석- 2장 이론적배경

올드코난 2010. 6. 4. 20:18
반응형

5절 데이터마이닝(Data Mining)기법

 

정보기술의 발달로 고객 및 거래에 대한 방대한 규모의 데이터베이스가 구축되고 있다. 여기서 정보 및 지식을 추출하여 경영의사결정에 활용하는 데이터마이닝은 많은 관심의 대상이 되고 있다. 데이터마이닝은 자동화된, 혹은 반자동화된 수단을 통해 방대한 양의 데이터 속에서 의미 있는 패턴이나 규칙을 찾아내기 위해 수행하는 일련의 탐색 및 분석과정을 의미한다. 이른바 지식탐색(knowledge discovery)이라고도 불리는 데이터 마이닝은 오늘날 인터넷으로 인해 양질의 고객 데이터가 방대한 규모로 축적되고 있는 상황에서 특히 관심이 모아지고 있다. 데이터마이닝 기법으로는 기본적인 통계적 기법부터 시작해서 인공지능 기법까지 다양한 종류들이 있는데, 이러한 기법들을 통해 우리는 분류(classification), 추정(estimation), 예측(prediction), 군집 (clustering) 등 여러 가지 목적을 달성할 수 있다[Berry and Linoff, 1997].  인터넷 쇼핑몰에서 고객에게 맞춤 서비스를 제공하는 목적으로도 데이터 마이닝 기법은 매우 효과적으로 사용될 수 있는데, 그 중에서도 특히 군집화(clustering)기법, 연관규칙(association rule) 기법, 분류(classification)기법 등은 가장 대표적으로 활용되는 기법이다. 여기서 군집화 기법의 경우는 주로 인터넷 쇼핑몰 고객들의 유사성 검색, 고객 세분화, 패턴 인식, 추세 분석 등에 활용되며, 연관규칙기법은 장바구니 분석이나, 고객 프로필과 구매 행동 간의 연관성 검색 등에 활용된다. 반면, 분류기법은 주로 고객의 구매 행동 예측에 활용되며, 통계적 회귀모형이나 의사결정나무, K-nearest neighbor 기법 등이 일반적으로 적용 된다[29]. 이러한 기법들 중에서 연관규칙기법은 일반적으로 구매 행위에 있어서 특정 아이템과 다른 아이템 간에 어떤 연관관계가 있는지를 찾아보는 것이다. 연관규칙기법은 비록 다른 데이터 마이닝 기법에 비해 단순하지만, 적용이 쉽고, 상당히 의미 있는 정보를 제공해 준다는 측면에서 인터넷 쇼핑몰의 상품추천시스템에서 가장 널리 적용되고 있는 기법 중 하나이다[35].

 


반응형