導言(痛點分析)

親愛嘅開發者、架構師們,你哋係咪正為以下問題而困擾?

隨住業務飛速發展,你哋嘅用戶量突破億級大關,傳統嘅推薦系統開始力不從心。基於離線批處理嘅推薦結果更新緩慢,無法捕捉用戶嘅實時興趣;面對突如其來嘅流量高峰期,系統反應延遲急升,用戶體驗急劇下降;同時,喺全量商品庫入面進行海量候選集召回同埋精準排序,計算耗時漫長,成為業務增長嘅瓶頸。

如果您正為推薦時效性、系統擴展性同高並發性能如果感到焦慮,咁騰訊雲為你準備嘅呢套基於向量數據庫同埋實時計算嘅毫秒級推薦架構,將會係你嘅最佳選擇。

解決方案架構圖同概覽

本方案嘅核心設計思想係:​利用實時流處理捕捉用戶瞬間興趣,借助高性能向量數據庫實現毫秒級相似檢索,最終融合長短期興趣做出精準推薦。​

一幅圖勝過千言萬語,以下係呢個方案嘅架構圖,清晰噉展示咗數據流動同核心組件嘅協同作用:

億級用戶推薦系統解決方案:向量數據庫+實時計算架構實現毫秒推薦 - LikaCloud

佢嘅工作流程(Workflow)如下:

  1. 即時採集:​​ 用戶喺前端產生嘅行為數據(例如點擊、瀏覽、收藏)會即時採集並傳送到TDMQ RocketMQ消息隊列,用嚟削峰填谷同解耦。
  2. 實時處理:​ ​流計算 Oceanus消費消息隊列入面嘅數據,做實時特徵提取、聚合,同埋調用模型快速推理,生成用戶嘅實時興趣向量
  3. 向量檢索:用戶嘅實時向量同預處理好嘅物品向量都儲存喺騰訊雲向量數據庫中。當需要進行推薦時,業務應用直接向向量數據庫發起查詢,其喺毫秒內返回最相似嘅物品集合。
  4. 數據與模型底座:​​ ​TBDS/WeData大數據平台負責離線嘅數據清洗、整合同用戶長期畫像構建。​TI-ONE機器學習平台用嚟訓練同產出高質量嘅深度學習推薦模型,為實時計算同向量化提供模型支撐。
  5. 業務集成:推薦業務邏輯(例如過濾、排序規則)部署喺CVM上面,透過內網安全、高速咁調用各類服務,並將最終推薦結果返畀用戶。

呢個架構完美解決咗引言中提出嘅實時性、擴展性同性能三大痛點。

核心產品同組件嘅詳細概覽

組件扮演角色關鍵配置/選擇建議點解要揀佢?
騰訊雲向量數據庫
(騰訊雲VectorDB)​
系統嘅核心,負責儲存所有物品同用戶向量,並提供毫秒級近似最近鄰搜索(ANN)選擇高效能實例類型,根據數據量(十億/百億級)揀合適規格。索引類型選擇HNSW以追求極致性能。專為向量搜索優化,性能遠遠超越傳統數據庫方案。單一索引支援千億級向量,​99.99% 高可用,免運維,極大降低開發同維運成本。
流計算 Oceanus實時計算大腦,負責處理用戶行為流,進行實時特徵計算同用戶向量生成。選擇Flink 版本,根據數據吞吐量揀CU(計算單元)數量。開啓Checkpoint功能保障狀態一致性。全託管Apache Flink服務,提供亞秒級處理延遲同高吞吐能力。唔使擔心集群運維,專注業務邏輯開發,輕鬆實現複雜事件處理。
消息隊列 TDMQ
(RocketMQ 版)
系統嘅神經中樞,負責承接所有實時用戶行為數據,並緩衝同解耦上下游系統。選擇RocketMQ 5.x 版本版本以獲得更好性能。Topic分區數設置要同並發消費者數量匹配,保證吞吐量。具備極致嘅吞吐能力同低延遲,完美支撐億級用戶嘅高並發寫入。完全兼容Apache RocketMQ生態,無縫對接現有系統。
大數據平台 WeData/TBDS數據基石,負責離線嘅數據ETL、數據質量管理同埋用戶長期畫像構建。使用WeData進行數據開發同任務調度,用TBDS處理超大型數據嘅儲存同計算。提供一站式數據治理能力,確保輸入到模型同實時系統嘅數據係準確、可靠嘅,從源頭保障推薦效果。
機器學習平台 TI-ONE推荐算法嘅引擎,用嚟训练同部署双塔模型、DNN等深度学习模型,生成高质素向量。使用Notebook进行特征同模型实验,使用訓練平台進行大規模分散式訓練,使用模型服務進行一鍵部署。提供由特徵工程到模型服務嘅全流程支援,內置多種演算法框架同優化組件,大幅提升演算法工程師嘅研發效率。
雲端伺服器 CVM & 私有網絡 VPC業務邏輯嘅承載者,用嚟部署推薦API服務、策略服務等業務應用。CVM揀計算優化型。所有組件部署喺同一地域嘅同一個VPC喺內部,確保網絡延遲最低、通訊最安全。VPC為所有雲端產品提供一個隔離、安全、高速嘅內網環境,係保障成個系統高性能同安全性嘅基礎。

方案優勢總結

  • ⚡ 毫秒級響應:憑藉騰訊雲向量數據庫嘅極致檢索性能,推薦召回延遲降低到毫秒級,用戶體驗順滑如絲。
  • ? 無限擴展:架構中各組件均採用分佈式設計,可以輕鬆水平擴展,從容應對由百萬到千億級用戶同物品嘅增長。
  • ? 精準推薦:​​ 實時計算同向量化檢索結合,既能反映用戶長期偏好,又可以敏銳捕捉實時興趣,推薦精準度顯著提升。
  • ?️ 穩定可靠:​​ 全託管服務提供自動故障轉移同高可用保障,系統可用性高達99.99%,為業務連續性保駕護航。
  • ? 降本增效:免除繁瑣嘅基礎設施運維,令開發同演算法團隊可以更專注於業務創新,總擁有成本(TCO)大幅降低。

應用場景同目標客戶

  • 典型應用場景:​
    • 電商平台:實現「猜你喜歡」、「睇完又睇」等實時個人化推薦,提升點擊率同GMV。
    • 內容資訊/短片平台:根據用戶即時瀏覽行為快速更新資訊流內容,增加用戶黏性同停留時間。
    • 音樂/電台應用:即時生成下一首播放推薦,營造沉浸式體驗。
  • 目標客戶檔案:
    • 用戶體量龐大(日活躍用戶過百萬),面臨嚴峻嘅性能同擴展性挑戰。
    • 業務對推薦結果嘅實時性要求極高,需要快速反饋用戶最新行為。
    • 技術團隊想採用業界領先架構,但希望減少運維投入,集中喺核心業務邏輯。

相關連結