최근 Recommender System KR의 클럽하우스에 들어가서 여러 회사와 학교에 계신 발표자 분들이 이야기하시는걸 들으면서, 강화학습을 Recommender system의 breakthrough 중 하나로 생각하시는분들이 꽤 있다는걸 알게되었다.
추천시스템은 real world에서 가장 활발하게 쓰이고 있는 분야이며 특히 고객을 늘리고 서비스에서의 체류시간을 늘리는 등 industrial business model에서 빠질수 없는 분야이다. 그리고 RL의 interaction 특징이 추천시스템과 사용자 사이의 관계와 밀접함에 따라, 그리고 RL의 장기적인 이익 최대화라는 특징이 사용자의 장기적인 만족도를 높히는 추천시스템의 목적과 밀접하다는 관점에서 RL의 또다른 유망 real-world application으로서 고려된다는것을 알았다.
그래서 Recommender System KR의 김지후님이 추천해주신 몇몇 대표 링크와 검색해본 강의 및 블로그들을 카테고리의 첫 포스팅으로 올려보면서 이 분야에대한 정리를 조금씩 해보고자 한다.
ACM의 추천시스템 대표 학회인 RecSys 2020에서 강화학습 관련 세션
RecSys – ACM Recommender Systems
Cluster-of-bandit policy leverages contextual bandits in a collaborative filtering manner and aids personalized services in the online recommendation system (RecSys). When facing insufficient observations, the cluster-of-bandit policy could achieve more ou
recsys.acm.org
강화학습을 Recommender system에 적용하는 연구들을 정리한 깃헙 레포1
cszhangzhen/DRL4Recsys
Courses on Deep Reinforcement Learning (DRL) and DRL papers for recommender systems - cszhangzhen/DRL4Recsys
github.com
강화학습을 Recommender system에 적용하는 연구들을 정리한 깃헙 레포2
guyulongcs/Deep-Reinforcement-Learning-for-Recommender-Systems
DRL for RecSys papers. Contribute to guyulongcs/Deep-Reinforcement-Learning-for-Recommender-Systems development by creating an account on GitHub.
github.com
구글 리서치의 RL for RecSys 에대한 강의1
www.youtube.com/watch?v=X3uozqaNCYE
구글 리서치의 RL for RecSys 에대한 강의2
www.youtube.com/watch?v=HEqQ2_1XRTs
Segey Kolesnikov 님의 포스팅
scitator.com/post/2101-recsys-rl-en/
RL in RecSys, an overview [EN] | Scitator
An overview of Reinforcement Learning in RecSys.
scitator.com
Recommender System KR의 김지민님이 추천해주신 RecSys의 REVEAL 2020 워크샵
REVEAL 2020
Video recording of the workshop Important dates: Submission deadline: July 29th Author notification: August 21st Camera-ready deadline: September 4th Workshop: September 26th State-of-the-art recommender systems are notoriously hard to design and improve u
sites.google.com
+ 지민님의 REVEAL 2020 번역 포스팅
[번역글] REVEAL’20 Workshop Introduction
REVEAL’20 Home을 번역한 글입니다. 문장이 길고 복문이 많아서 짧은 단문으로 고쳐 썼습니다.
ziminpark.github.io
지민님이 정리해두신 Bandit 관련 스터디 자료
www.notion.so/Bandit-Based-cae4bc6ecf9c412dbfb5287abdccb704
Bandit-Based 추천 시스템 공부 계획
*** 목표 *** 1. 어떤 상황에서 Bandit 기반 추천을 사용해야 하는지 이해합니다. 2. Bandit 기반 추천 논문에서 나오는 용어와 baseline 모델을 익힙니다. 3. Bandit 기반 추천 모델의 평가를 어떻게 할지
www.notion.so
Amazon ML 엔지니어인 Ankit Sirmorya의 포스팅
https://pub.towardsai.net/natural-language-processing-b36102774c37
Natural Language Processing
Reinforcement Learning in Recommendation Systems
pub.towardsai.net