社會計算複習 之 REVIEW RECOMMENDER SYSTEMS
什麼是Racommender system
A system which could recommand stuff based on others people did
為什麼要使用推薦系統
在購物網站上,我們有太多的選擇
廣告的種類太多
找到最好的網站
推薦影片和書籍
幫助使用者選擇他們想要的,幫助使用者根據goal做正確的決定
推薦的演算法
基於特徵的推薦演算法 Feature Based (content based)
基於一件事物的特點推薦另一件事物,比如說超人1的電源會推薦超人2
喜歡一個導演就會推薦這個導演的作品;喜歡一個演員就會推薦這個演員的作品
推薦可以給予該使用者對於一件事物的rate, Recommendation based on the commonalities among
the items that a user has rated before
Feature Based 演算法優點
- 不需要複雜的計算就可以離線處理,計算時間少
- 推薦的東西便於解釋
比如說Gmail AD他會根據你的Email分析出你喜歡什麼東西,從而傳送廣告給你
Feature Based 演算法問題
- Overspecialization
- 僅推薦與評級過的東西相似的東西,比如說超人1那麼只會推薦DC的Mavel的電影,然而哈利波特將會無法被推薦
- 特性取決於上下文、和內容的種類
- 沒有小組智慧 No Wisdom from Group
協同過濾演算法 Collaborative filtering
基於其他使用者的評價,或者是基於鄰居或相同或相似的人的意見(Neighboor)
它使用統計學的方法,從而做出對於相似使用者和產品的預測,統計方法有兩種:一種是User to User,一種是item to item
比如說,其他使用者買了這本書的同時也購買了另一本書,所以,也向你推薦另一本書
協同過濾演算法的好處
- Content is irrelevant, 任何內容無關緊要
- 擁有了群組智慧
- 在商業界和學術界最常用adopted and studied
協同過濾演算法問題
- Cold Start Problem,就是必須要有幾個rating該演算法才可以執行
- Too Expensive,演算法比較複雜
- 人類是會變得,有時候他的愛好會產生變化
混合演算法 Hybird
就是基於feature base 和 Collaborative filtering
不會的知識點
User to user的演算法
- Build Matrix of thing each user bought / viewed / rated
- Compute similarity between user
- Find similar user to you
- Recommand stuff they bought/ view rate that you have not yet.
item to item的演算法
根據你喜歡什麼推薦相似的東西,因為一本數學書永遠都是數學書,但是一個人就一直都會變;所以說item based similarity change less frequently than user based similarity
比user更好的原因是,我們只需要處理幾個item就可以了,而如果我們需要處理user的話,就需要處理很多人。
Less storage, Faster computing
想要看到更多瑋哥的學習筆記、考試複習資料、面試準備資料?想要看到IBM工作時期的技術積累和國外初創公司的經驗總結?
image
敬請關注: