零基礎(chǔ)科普:4種簡(jiǎn)單推薦算法背后的原理
導(dǎo)讀:大數(shù)據(jù)平臺(tái)只是提供了數(shù)據(jù)獲取、存儲(chǔ)、計(jì)算、應(yīng)用的技術(shù)方案,真正挖掘這些數(shù)據(jù)之間的關(guān)系讓數(shù)據(jù)發(fā)揮價(jià)值的是各種機(jī)器學(xué)習(xí)算法。在這些算法中,最常見(jiàn)的當(dāng)屬智能推薦算法了。下面通過(guò)幾種簡(jiǎn)單的推薦算法來(lái)了解一下推薦算法背后的原理。
作者:李智慧 來(lái)源:大數(shù)據(jù)DT(ID:hzdashuju)

我們?cè)谔詫氋?gòu)物,在頭條閱讀新聞,在抖音刷短視頻,背后其實(shí)都有智能推薦算法。這些算法不斷分析、計(jì)算我們的購(gòu)物偏好、瀏覽習(xí)慣,然后為我們推薦可能喜歡的商品、文章、視頻。這些產(chǎn)品的推薦算法如此智能、高效,以至于我們常常一打開(kāi)淘寶就買(mǎi)個(gè)不停,一打開(kāi)抖音就停不下來(lái)。
01 基于人口統(tǒng)計(jì)的推薦
基于人口統(tǒng)計(jì)的推薦是相對(duì)簡(jiǎn)單的一種推薦算法,它會(huì)根據(jù)用戶的基本信息進(jìn)行分類(lèi),然后將商品推薦給同類(lèi)用戶,如圖1所示。

▲圖1 基于人口統(tǒng)計(jì)的推薦算法
用戶A和用戶C的年齡相近、性別相同,可以將他們劃分為同類(lèi)。用戶A喜歡商品D,因此推測(cè)用戶C可能也喜歡這個(gè)商品,系統(tǒng)就可以將這個(gè)商品推薦給用戶C。
圖1中的示例比較簡(jiǎn)單,在實(shí)踐中,還應(yīng)該根據(jù)用戶收入、居住地區(qū)、學(xué)歷、職業(yè)等各種因素對(duì)用戶進(jìn)行分類(lèi),以使推薦的商品更加準(zhǔn)確。
02 基于商品屬性的推薦
基于商品屬性的推薦和基于人口統(tǒng)計(jì)的推薦相似,只是它是根據(jù)商品的屬性進(jìn)行分類(lèi),然后根據(jù)商品分類(lèi)進(jìn)行推薦的,如圖2所示。

▲圖2 基于商品屬性的推薦
電影A和電影D都是科幻、戰(zhàn)爭(zhēng)類(lèi)型的電影,如果用戶A喜歡電影A,很有可能他也會(huì)喜歡電影D,因此就可以給用戶A推薦電影D。
這和我們的生活常識(shí)也是相符合的。如果一個(gè)人連續(xù)看了幾篇關(guān)于籃球的新聞,那么再給他推薦一篇籃球的新聞,他很大可能會(huì)有興趣看。
03 基于用戶的協(xié)同過(guò)濾推薦
基于用戶的協(xié)同過(guò)濾推薦是根據(jù)用戶的喜好進(jìn)行用戶分類(lèi),然后根據(jù)用戶分類(lèi)進(jìn)行推薦,如圖3所示。

▲圖3 基于用戶的協(xié)同過(guò)濾推薦
這個(gè)示例中,用戶A和用戶C都喜歡商品A和商品B,根據(jù)他們的喜好可以分為同類(lèi)。用戶A還喜歡商品D,那么將商品D推薦給用戶C,他可能也會(huì)喜歡。
現(xiàn)實(shí)中,跟我們有相似喜好、品味的人也常常被我們當(dāng)作同類(lèi),我們也愿意去嘗試他們喜歡的其他東西。
04 基于商品的協(xié)同過(guò)濾推薦
基于商品的協(xié)同過(guò)濾推薦則是根據(jù)用戶的喜好對(duì)商品進(jìn)行分類(lèi),然后根據(jù)商品分類(lèi)進(jìn)行推薦,如圖4所示。

▲圖4 基于商品的協(xié)同過(guò)濾推薦
這個(gè)示例中,喜歡商品B的用戶A和用戶B都喜歡商品D,那么商品B和商品D就可以分為同類(lèi)。對(duì)于同樣喜歡商品B的用戶C,很有可能也喜歡商品D,就可以將商品D推薦給用戶C。
這里描述的推薦算法比較簡(jiǎn)單。事實(shí)上,要想做好推薦其實(shí)是非常難的,用戶不要你覺(jué)得他喜歡,而要自己覺(jué)得喜歡?,F(xiàn)實(shí)中,有很多智能推薦的效果并不好,被用戶吐槽是“人工智障”。推薦算法的優(yōu)化需要不斷地收集用戶的反饋,不斷地迭代算法和升級(jí)數(shù)據(jù)。

也可以加一下老胡的微信 圍觀朋友圈~~~
推薦閱讀
(點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)
2021年,機(jī)器學(xué)習(xí)研究風(fēng)向要變了?
【機(jī)器學(xué)習(xí)】隨機(jī)森林是我最喜歡的模型
Python之父:Python 4.0可能不會(huì)來(lái)了
老鐵,三連支持一下,好嗎?↓↓↓
