Giới thiệu (Phân tích điểm đau)​

Đối với các nhà phát triển backend và kiến trúc sư của các nền tảng nội dung, trang web thương mại điện tử hoặc ứng dụng cấp doanh nghiệp đang phát triển nhanh chóng, một công cụ tìm kiếm mạnh mẽ và linh hoạt là cơ sở hạ tầng cốt lõi để nâng cao trải nghiệm người dùng và hiệu quả nghiệp vụ. Tuy nhiên, khi tự xây dựng hoặc sử dụng dịch vụ tìm kiếm trên mây truyền thống, bạn có thường xuyên bị những vấn đề này làm phiền không:

  • Đỉnh lưu lượng khó đối phó:Khi gặp sự kiện khuyến mãi lớn hoặc sự kiện nóng, QPS truy vấn tăng vọt trong tích tắc, tài nguyên cụm cố định không thể chịu tải, dẫn đến dịch vụ tìm kiếm phản hồi chậm hoặc thậm chí ngừng hoạt động, ảnh hưởng trực tiếp đến chuyển đổi người dùng và doanh thu kinh doanh.
  • Tài nguyên và chi phí khó cân bằng:Để đảm bảo tính ổn định trong thời kỳ cao điểm, bạn buộc phải cấu hình tài nguyên theo lưu lượng cao nhất, nhưng trong phần lớn thời gian bình thường, một lượng lớn tài nguyên tính toán và lưu trữ ở trạng thái nhàn rỗi, gây lãng phí chi phí khổng lồ.
  • Độ phức tạp vận hành cao:​​ Các công việc vận hành như mở rộng/thu nhỏ cụm, nâng cấp phiên bản, quản lý chỉ mục, tối ưu hiệu suất đòi hỏi đầu tư đội ngũ chuyên môn và nhiều công sức, ngưỡng kỹ thuật cao, làm phân tán sự tập trung vào nghiệp vụ cốt lõi.

Nếu bạn đang gặp khó khăn với tính ổn định, chi phí cao và vận hành nặng nề của dịch vụ tìm kiếm, bài viết này sẽ cung cấp cho bạn một giải pháp tìm kiếm đàn hồi trên nền tảng đám mây hoàn chỉnh.​

Sơ đồ kiến trúc và tổng quan giải pháp

Mục tiêu:​Một bức tranh đáng giá ngàn lời, mang đến cho người đọc một cái nhìn tổng quan.

Sơ đồ kiến trúc:​

Giải pháp tìm kiếm đàn hồi: Công cụ tìm kiếm gốc đám mây Elasticsearch Service hỗ trợ chi phí thấp cho việc truy cập đỉnh điểm nghiệp vụ - LikaCloud

Tổng quan kiến trúc:​

Ứng dụng của người dùng (Web/App/máy chủ) khởi tạo yêu cầu tìm kiếm, đầu tiên thông qua bộ cân bằng tải của Tencent Cloud (CLB) để phân phối lưu lượng, sau đó yêu cầu truy cập vào dịch vụ Elasticsearch (ES) của Tencent Cloud thông qua mạng riêng ảo (VPC) an toàn. Cụm ES sử dụngKiến trúc ServerlessNhóm co giãn tự động dựa trên các chỉ số giám sát,có thể mở rộng nút tính toán theo giây dựa trên áp lực truy vấn thời gian thực. Dữ liệu được ghi thời gian thực thông qua các thành phần như Kafka, trong cụm ES, thông qua cơ chếphân tách nóng lạnh thông minh, lưu trữ dữ liệu nóng được truy cập thường xuyên trên ổ đĩa SSD để đảm bảo hiệu suất, tự động chuyển dữ liệu lạnh được truy cập ít thường xuyên xuống lưu trữ đối tượng (COS), và giảm thêm chi phí lưu trữ thông qua công nghệ nén ZSTD. Toàn bộ giải pháp đảm bảo thời gian phản hồi mili giây và tính khả dụng cao, đồng thời đạt được tối ưu chi phí tối đa.

Đề xuất Giá trị:Giải pháp này thông quaĐàn hồi tối đaXử lý lưu lượng đỉnh điểm, thông quaPhân tầng thông minh và nénGiảm chi phí tổng hợp, thông quaDịch vụ quản lý toàn phầnLoại bỏ gánh nặng vận hành, giải quyết hoàn hảo tất cả các điểm đau đã nêu trong phần giới thiệu.

Giải thích chi tiết về sản phẩm cốt lõi và thành phần

  • Tên thành phần:​​ ​Dịch vụ Elasticsearch (ES) của Tencent Cloud​
    • Đóng vai trò:​​ Là cốt lõi của toàn bộ giải pháp, cung cấp dịch vụ công cụ tìm kiếm và phân tích phân tán, xử lý tất cả các yêu cầu lập chỉ mục và truy vấn dữ liệu.
    • Các đề xuất cấu hình/lựa chọn quan trọng:
      • Lựa chọn kiến trúc:Đối với các tình huống có lưu lượng biến động cực lớn, chúng tôi mạnh mẽ khuyến nghị sử dụngPhiên bản Serverless, nó thực sự đạt được thanh toán theo nhu cầu và khả năng co giãn linh hoạt ở mức mili giây. Đối với các tình huống có biến động theo quy luật, có thể chọn phiên bản co giãn linh hoạt, thiết lập chiến lược co giãn dựa trên tỷ lệ sử dụng CPU hoặc QPS truy vấn.
      • Cấu hình nút:Khuyến nghị kích hoạtNút chủ độc quyềnđể nâng cao tính ổn định của cụm; nút dữ liệu sử dụngLoại IO caoĐa năngMáy ảo, kết hợp với ổ đĩa SSD đám mây để có hiệu suất I/O tốt nhất.
      • Cấu hình chức năng:Phải bậtQuản lý vòng đời chỉ mục (ILM)tính năng, tự động hóa phân tầng nóng/ấm/lạnh; kích hoạtnén ZSTDđể đạt tỷ lệ nén cao hơn và tốc độ nén nhanh hơn.
    • Tại sao chọn nó:​​ Dịch vụ Elasticsearch toàn quản lý của Tencent Cloud ES tương thích 100% với Elasticsearch mã nguồn mở, cung cấp tất cả các tính năng của phiên bản mã nguồn mở, đồng thời có thêm các tính năng gia tăng như bảo mật cấp doanh nghiệp, giám sát cảnh báo, nâng cấp một click. Người dùng không cần quan tâm đến cơ sở hạ tầng bên dưới, chỉ cần tập trung vào logic nghiệp vụ tìm kiếm.
  • Tên thành phần:​​ ​Dịch vụ lưu trữ đối tượng (COS) của Tencent Cloud​
    • Đóng vai trò:​​ Là lớp lưu trữ cơ sở cho dữ liệu lạnh của ES, lưu trữ dữ liệu lưu trữ được truy cập tần suất thấp, cung cấp dịch vụ lưu trữ độ tin cậy cao với chi phí cực thấp.
    • Các đề xuất cấu hình/lựa chọn quan trọng:​ Tạo dữ liệu lạnh cho ESLưu trữ tiêu chuẩnLưu trữ tần suất thấpChỉ cần bucket, độ bền lên đến 99.9999999999% (12 số 9), không cần cấu hình thêm.
    • Tại sao chọn nó:​Chi phí lưu trữ của COS thấp hơn nhiều so với lưu trữ khối hiệu suất cao. Thông qua tích hợp liền mạch với tính năng ILM của ES, dữ liệu lạnh có thể được chuyển xuống đây một cách vô hình, giảm chi phí lưu trữ hơn 80% mà không làm mất khả năng truy xuất dữ liệu.
  • Tên thành phần:​​ ​Tải cân bằng đám mây Tencent (CLB)
    • Đóng vai trò:​Là cổng vào thống nhất của dịch vụ, tự động phân phối lượng lớn yêu cầu tìm kiếm đến nhiều nút dữ liệu ES phía sau, loại bỏ lỗi điểm đơn và cung cấp các khả năng như dỡ tải HTTPS.
    • Các đề xuất cấu hình/lựa chọn quan trọng:Lựa chọnCLB loại ứng dụngCấu hình làm bộ lắng nghe TCP/UDP, chuyển tiếp đến cổng 9200 của nút ES. Khuyến nghị gán IP công cộng đàn hồi và cấu hình giới hạn băng thông.
    • Tại sao chọn nó:​Thực hiện cân bằng tải lưu lượng truy cập, nâng cao tính khả dụng và khả năng mở rộng của dịch vụ, đồng thời che giấu các chi tiết nội bộ của cụm máy chủ phía sau đối với máy khách, dễ quản lý hơn.

Tổng kết ưu điểm của giải pháp

  • ⚡ Đàn hồi cực đỉnh, mở rộng/thu nhỏ trong vài giây:Sử dụng Serverless hoặc nhóm co giãn đàn hồi, có thể mở rộng ngay lập tức đến quy mô cần thiết dựa trên áp lực nghiệp vụ, tự động thu hồi tài nguyên sau khi lưu lượng đỉnh qua đi, thực sự thanh toán theo mức sử dụng.
  • 💸 Giảm đáng kể chi phí tổng hợp:​​ Thông qua công nghệ phân tách dữ liệu nóng/lạnh thông minh và nén ZSTD, giảm chi phí lưu trữ dữ liệu lạnh hơn 80%, tránh lãng phí do dự trữ tài nguyên quá mức cho đỉnh tải, chi phí tổng hợp có thể tối ưu hơn 50%.
  • 🛡️ Sử dụng ngay, sẵn sàng cho doanh nghiệp với tính khả dụng cao:​​ Cung cấp SLA khả dụng dịch vụ 99.95%, tích hợp cơ chế bản sao, triển khai đa vùng khả dụng, khả năng chuyển đổi dự phòng tự động, cùng các tính năng bảo mật như cách ly mạng VPC, nhóm bảo mật, nhật ký truy cập, đảm bảo tính liên tục kinh doanh và an toàn dữ liệu.
  • 🔧 Không cần vận hành, tập trung vào đổi mới nghiệp vụ:​​ Dịch vụ được quản lý toàn phần giúp loại bỏ các công việc vận hành phức tạp như triển khai phần cứng, cài đặt phần mềm, nâng cấp phiên bản, khôi phục sự cố. Bạn chỉ cần cấu hình đơn giản thông qua bảng điều khiển hoặc API để có được khả năng tìm kiếm mạnh mẽ, giúp nhóm tập trung hơn vào phát triển nghiệp vụ cốt lõi.

Kịch bản ứng dụng và khách hàng phù hợp

  • Các tình huống ứng dụng điển hình:​
    • Website/Ứng dụng thương mại điện tử:​Tìm kiếm, lọc và danh sách đề xuất sản phẩm, đối phó với lượng truy vấn khổng lồ tức thời trong các đợt khuyến mãi lớn như 618, Ngày Độc thân 11/11.
    • Nền tảng nội dung và thông tin:Tìm kiếm từ khóa và tìm kiếm toàn văn cho nội dung như tin tức, video, bài viết.
    • Phân tích nhật ký và giám sát vận hành (ELK):Thu thập, lưu trữ và phân tích dữ liệu nhật ký khổng lồ từ máy chủ và ứng dụng doanh nghiệp theo thời gian thực, để khắc phục sự cố và đưa ra những hiểu biết sâu sắc về hoạt động kinh doanh.
    • Tìm kiếm dữ liệu nội bộ doanh nghiệp:Chẳng hạn như truy vấn thông tin khách hàng, đơn hàng, sản phẩm trong các hệ thống như CRM, ERP.
  • Đặc điểm khách hàng phù hợp:​
    • Khối lượng công việc kinh doanh có sự biến động rõ rệt giữa giờ cao điểm và thấp điểm, và thời điểm cao điểm rất khó dự đoán.
    • Khối lượng dữ liệu khổng lồ (cấp TB-PB), với đặc điểm truy cập nóng/lạnh rõ rệt.
    • Các doanh nghiệp vừa và lớn theo đuổi tỷ lệ hiệu suất/chi phí cao, mong muốn tối ưu hóa chi phí hạ tầng.
    • Tất cả nhà phát triển thiếu đội ngũ vận hành Elasticsearch chuyên nghiệp, mong muốn có dịch vụ tìm kiếm ổn định, đáng tin cậy và sẵn sàng sử dụng ngay.

Các liên kết có liên quan

Giới thiệu Dịch vụ Elasticsearch Service của Tencent Cloud Dịch vụ phân tích và tìm kiếm dữ liệu quy mô lớn được quản lý hoàn toàn trên đám mây
Dịch vụ lưu trữ đối tượng (COS) của Tencent Cloud​ Gói ưu đãi cho người dùng mới trên đám mây giảm 1.3 lần trong ba năm
Cân bằng tải Tencent Cloud (CLB) Cung cấp dịch vụ phân phối lưu lượng bốn bảy tầng an toàn và nhanh chóng
Hướng dẫn thực hành tìm kiếm vector hiệu suất cao cấp tỷ ES 8.16.1 hỗ trợ tìm kiếm vector lên đến hàng tỷ