배움/자료

전자상거래 추천시스템에 관한 동향분석- 제 3 장 추천시스템의 연구 및 적용사례

올드코난 2010. 6. 4. 20:23
반응형

2절 개인별 상품추천시스템 WebCF-PT[1]

 

협업추천시스템의 문제점인 희박성과 확장성문제를 해결하기 위해 다양한 연구활동이 이루어지고 있다. 저자는 웹마이닝(Web mining) 과 상품계층도(Product Taxonomy)를 이용하여 그러한 문제를 해결하고자 하였다. 웹마이닝은 입력데이터의 희박성문제를 해결하기 위해 고객이 인터넷 쇼핑몰에서 상품을 처음 인식하는 행동에서부터 상품을 클릭하고 장바구니에 담아 상품을 구매하기 까지의 과정에 대한 웹 기반 정보를 이용하여 보다 많은 고객 선호도 정보를 확보하기 위해 적용한 것이다. 상품계층도는 관련 있는 상품들을 특정 상품군으로 군집화하여 선호도 입력 데이타의 희박성과 시스템확장성문제를 동시에 해결하기 위해 적용한다. 상품계층도는 개별상품을 추상 개념이 낮은 상품클래스로 분류하고 이들 상품 클래스를 다시 추상개념이 좀더 높은 상품 클래스로 분류한 계층구조를 말하면 일반적으로 개별상품, 상품카테고리, 상품군 등의 순서로 형성된다. <그림7>은 상품계층도의 예이다. 상품계층을 결정하는데 좀더 유연한 방법을 채택하기 위해 저자는 Cho and Kim[30]이 제안한 그레인(Grain) 개념을 도입했다. 그레인은 상품계층도에서 개별상품의 수가 너무 많을 때 개별상품들을 클래스로 묶을 때 사용하기 위한 방법으로 Adomavicius and Tuzhilin(2001)에 의해 소개된 (cut)”의 기본원리를 이용한 것이다. <그림7> 상품계층도는 혼합수준 그레인을 보인 것이다. 최근 많은 데이터마이닝 관련 연구들이 데이터 분석에서의 상품계층도의 필요성 및 중요성을 지적하고 있다.


품계층도상에서 유사한 선호도 패턴을 갖는 개별상품들을 정 상품군으로 군집화하여 입력데이터의 차원을 축소하면 이웃 집단 탐사과정에서 계산속도의 향상을 도모 하여 시스템 확장성문제를 해결할 수 있다[1]. 협업추천시스템의 문제를 해결하기 위해 저자는 WebCF-PT(Web-based Collaborative Filtering Using Product Taxonomy) 시스템을 개발 했다. 또한 WebCF-PT시스템을 적용하기 위하여 실험목적의 인터넷 쇼핑몰을 개발하여, 실제로 적용되는 사례를 제시했다. 제안된 연구는 상품계층도를 입력 데이터의 희박성을 줄이고, 시스템확장성을 향상시키기 위해 적용하였다. 그리고, 고객의 선호도를 파악하기 위해 기존의 일반적인 방법인 고객들에게 직접설문을 통하여 파악하지 않고 암묵적으로 고객의 온라인 쇼핑 행태를 분석하는 웹마이닝 기법을 개발했다. 또한 저자는 WebCF-PT 프로토타입 시스템을 개발하고 이를 적용하기 위해 실험목적의 EBIB (E-Business & Intelligence Business) Research 쇼핑몰을 구축하였다. <그림8> WebCF-PT추천방법의 개략적 절차이다.단계1상품 계층 결정단계로 데이터베이스 내의 모든 상품을 마케팅 전문가가 특정그룹으로 분류 재구성하여 입력 데이터의 차원을 감소시키는 단계이다. 단계2고객 프로파일 형성단계로 인터넷 쇼핑몰에서 개별고객의 쇼핑행위를 추적하여 얻은 데이터를 통해 목표고개의 상품 선호도 정보를 발견하고, 분석한 정보를 이용하여 고객 프로파일을 형성하는 단계이다. 단계3이웃 집단 탐색단계로 형성된 고객 프로파일을 이용하여 고객간의 유사도를 계산하고, 이를 기반으로 목표고객과 유사한 성향을 가진 고객들을 선택하여 이웃을 형성하는 단계이다. 단계4추천 상품 결정단계로 형성된 이웃들의 쇼핑행위를 기반으로 선호도가 높은 상위 N개의 상품을 선택하여 추천 상품의 목록을 결정하는 단계이다. <그림9> WebCF-PT추천시스템의 구조도이다. 그림에서 웹로그 분석 에이전트 (Web Log Analysis Agent), 데이터 변환 에이전트 (Data Transformation Agent), 추천에이전트 (Recommender Agent)로 구성되어 있다.

각 구성요소들의 기능을 살펴보면, 웹로그 분석 에이전트가 방대한 양의 웹로그 파일을 전처리하여 웹로그 데이터베이스에 저장하며, 데이터 변환 에이전트는 운영 데이터베이스와 웹로그 데이터베이스로부터 상품추천에 사용될 데이터를 추출, 정제, 변환하여 데이터 마트에 저장한다. 추천 에이전트는 추천알고리즘을 통해 고객별로 개인화된 상품추천 목록을 작성하고 고객 선호도, 추천에 사용된 데이터, 그리고 실시간 추천을 제공하기 위한 추천목록을 데이터 마트에 저장한다. 저자는 WebCF-PT추천시스템을 프로토타입 시스템으로 개발하고 이를 적용하기 위하여 실험목적의 EBIB Research 쇼핑몰을 개발했다. <그림10>은 쇼핑몰 초기화면이다. WebCF-PT추천시스템의 이해를 돕기 위해 어떤 고객이 상품을 구매하고 추천을 받는 과정을 살펴보겠다. 고객 Kim은 회원가입을 하기 위해 <그림10>에 나타난 EBIB Research 쇼핑몰 초기화면에서 사용자 ID, 이름, e-mail, 생년월일, 성별, 주소와 같은 데이터를 입력한다. Kim에게는 사이버 머니 백 만원이 지급되고, 사이버 머니 한도 내에서 원하는 상품을 구매 할 수 있도록 한다. 회원가입이 성공적으로 끝나면 자동적으로 로그인 되어 EBIB Research 쇼핑몰에 접속한다. 다음에 방문할 때는 회원가입 없이 개인화된 서비스를 받을 수 있다.

고객 Kim이 회원가입을 한 후 웹사이트를 방문하고 상품구매를 하기 위해 웹 서핑을 하면, 해당 웹서버는 자동적으로 회원의 방문과 관련된 로그가 저장된다. WebCF-PT추천시스템은 웹 로그 에이전트를 이용하여 웹 로그 파일을 전처리 한 후, 상품상세보기는  ‘goods_ view.asp’, 장바구니 담기는 ‘cart_list.asp’, 구매는 ‘cart_pay.asp’로 매핑하고, 쇼핑행위와 관련된 데이터를 추출한다. <그림12>에서 Kim은 스킨케어 상품군이 가장 높은 선호도 점수를 얻었고, 기타 상품군이 두 번째로 높은 선호도를 보였다. Kim의 프로파일은 <그림7>의 혼합그레인과 웹마이닝을 기반으로 구했고, 이웃고객은 Kim의 프로파일을 사용하여 구했다.
Cho and Kim [30]은 이웃의 수는 50명 정도 일 때 좋은 성능을 보이고, 추천방법 중 MFR이 좋은 성과를 보인다는 것을 실험을 통해 증명했다. 제안된 연구는 가입자 수가 충분하지 않아 50명일 때와 큰 차이가 없는 30명을 이웃의 수로 선택 하였고 MFR추천방법을 사용했다. 상품 참조빈도가 높은 상품 중 Kim이 과거에 구매한 상품을 제외한 상위 10개를 선택하여 추천한다. <그림13> Kim에게 제공된 개인화된 추천상품리스트를 보여준다.
제안된 연구에서 구축한 쇼핑몰에서 고객이 상품 둘러보기를 하고 장바구니에 담고, 사이버머니로 상품을 구매하게 되면 그러한 고객정보를 바탕으로 제공한 추천 상품리스트와 고객의 구매 데이터만을 이용한 추천 상품리스트를 고객들과의 인터뷰를 통해 비교했다. 다양한 정보를 바탕으로 제시한 상품추천리스트가 더욱 고객의 선호도가 부합된다는 결과가 나타났지만, 피실험자수가 충분하지 않고 비교분석은 제대로 이루어지지 않았다. 비교분석방법으로는 고객들로부터 구매하고 싶은 목록을 제공 받고 이를 WebCF-PT에 의한 추천목록과 비교해보면 WebCF-PT시스템의 효과성을 검증할 수 있는 좋은 방법이고 추후 연구에서 보강할 예정이다[1]. 자세한 내용은 [1]을 참조하기 바란다. WebCF-PT의 연구는 안도현외(2004)가 처음 제안하였다. 안도현외(2004)는 전통적 CF방법과 WebCF-PT방법의 정확도를 비교했다. <그래프1><5>는 실험의 결과이다. <그래프1>을 보면 제안한 WebCF-PT방법이 전통적인 CF방법보다 정확도가 평균 32% 우수하다.

<5>에서 WebCF-PT방법이 전통적 CF방법보다 약 18배 정도 빠른 응답을 보였다. 이러한 결과는 전자상거래의 빠른 성장으로 인한 고객과 상품 수의 급속하게 증가되고 있는 상황에서 중요하다 [안도현외, 2004].

<5> 전통적 CF방법과 WebCF-PT방법의 성능 비교

 

CF

WebCF-PT

응답시간()

91.53

4.87

반응형