4.Recommender_System

4 minute read

추천 시스템의 정의

특정 시점에 특정 고객이 좋아할 만한 리스트를 찾아주는 것

과거 추천 시스템의 동향

과거의 추천 시스템에서는 KDD라는 방법론을 기반으로 알고리즘 개발 착수.
- KDD(Knowledge Discover in Database): 데이터셋에서 유의미한 규칙을 찾아내는 것
- 대표적인 방법: Association Rule
- Association Rule
  - 고객들의 상품 묶음 정보를 규칙으로 표현하는 가장 기본적인 알고리즘.
  - 기초적인 확률론에 기반한 방법으로, 전체 상품중에 고객이 함께 주문한 내역을 살펴본 뒤 상품간의 연관성을 수치화하여 나타내는 알고리즘.
  - 가장 직관적이고 구현도 쉽지만, 성능이 떨어지는 알고리즘은 아니고 현재도 가장 중요한 알고리즘으로 분류됨.
- 추천의 타입
  - Personalized recommender(개인화 추천): 유저의 정보에 기반하여 자동으로 아이템 리스트를 추려냄.
    - 매칭되는 알고리즘: CF(Collaborative Filtering)
  - Non-personalized recommender: rating 기반의 인기 상품이나 현재 상품 기준 AR(Association Rule) 순위 상품을 추천함. Cold Start Problem(개인화 추천 모델링을 위한 유저정보 혹은 아이템 정보가 부족한 상황)이 발생하는 상황이나 개인화추천이 잘 적용되지 않는 추천 영역에서 사용.
    - 매칭되는 알고리즘: AR(Association Rule)
  - Attribute-based recommender: Contents 정보를 활용하여 추천하는 방법. Cold Start 문제를 해결하는 조금 더 세련된 방법.
    - 매칭되는 알고리즘: content based approach

현재 추천 시스템의 동향

과거와 기본적으로 다르지 않지만, 딥 러닝을 위시한 부분적으로 더욱 고도화된 알고리즘들이 적용되고 있으며, 하둡으로 대표되는 빅데이터 처리 플랫폼이 매우 안정화됨.
통계 기반의 모델링:
- 상품에 대한 암묵 점수들의 분포를 통계적으로 살펴보는 것이 의미가 있을 수 있음.
- 가설에 기반하여 실제의 분포나 반응이 얼마나 다른지를 검정하는 통계 검정 기법으로 카이제곱 검정 등의 통계 기법을 사용할 수 있음.
- 원시적이지만 때때로 강력함.
CF(Collaborative Filtering) 기반의 모델링:
- 가장 널리 알려져 있고, 대부분의 추천 시스템이 이 방법으로 구축.
- 이 모델링을 기본으로, 다양한 응용 알고리즘이 있고, 발전시키거나 다른 알고리즘과 접목하는 방향으로 옮겨감.
- 연관성이라는 측면때문에, 일부 논문 등의 자료에서는 AR도 CF 기반의 모델링으로 분류하기도 함.
딥 러닝 기반의 모델링:
- 비교적 최근의 연구결과를 바탕으로 부분적으로 적용되고 있는 방법.
- Content based 모델링 기법에서 이미지 등의 특별한 데이터를 다루기 위한 모델링을 하기도 하며, word2vec으로 대표되는 언어 처리 알고리즘을 키워드 분류 등에 사용하기도 함.
- 현재 가장 활발하게 연구 및 개발이 이루어지고 있는 분야.
절대적인 방법론은 없고, 추천 시스템을 구축하는 기술자 또는 사용하는 고객에 맞추어서 사용.
사용자와 비슷한 유저가 좋아 할 만한 아이템을 추천해줘야 하는 경우엔 CF모델링이 유용할 것이고, 이미지 추천과 같이 기계가 자동으로 정보를 추출해내 주어야 하는 경우에는 딥 러닝 모델링이 성능이 좋을 수 있음.

Jeong Min

4.Recommender_System

추천 시스템의 정의

추천 시스템이 고려해야 할 요소

추천 시스템의 장애 요소

과거 추천 시스템의 동향

현재 추천 시스템의 동향

추천 시스템을 평가하는 방법

추천 시스템

You May Also Enjoy

6.OCR(Optical Character Recognition)

5.이력서 자동추천 시스템

3.Word_Embedding

2.Word2vec