Giới thiệu (Phân tích điểm đau)​

Kính gửi các CTO, Giám đốc Dữ liệu và Kiến trúc sư tại doanh nghiệp tài chính, trong làn sóng chuyển đổi số, liệu bạn có đang lo lắng về những vấn đề sau?

  • Lỗ hổng dòng dữ liệu:​Khi yêu cầu giám sát cần truy xuất nguồn gốc của dữ liệu báo cáo nào đó, phải mất nhiều ngày để sắp xếp thủ công, không thể trả lời nhanh chóng và rõ ràng "dữ liệu đến từ đâu, đã trải qua những xử lý nào".
  • Chất lượng dữ liệu đáng lo ngại:Các chỉ số nghiệp vụ then chốt không nhất quán giữa các hệ thống khác nhau, dữ liệu bẩn, dữ liệu trùng lặp ảnh hưởng nghiêm trọng đến quyết định quản lý rủi ro và độ chính xác của báo cáo nghiệp vụ, nhưng thiếu các biện pháp giám sát và kiểm tra hiệu quả.
  • Dữ liệu nhạy cảm mất kiểm soát:​ Thông tin nhạy cảm như số CMND, số thẻ ngân hàng của khách hàng nằm rải rác khắp nơi, việc ai đang truy cập, dữ liệu lưu chuyển ra sao hoàn toàn không minh bạch, đối mặt với rủi ro tuân thủ và nguy cơ rò rỉ lớn.
  • Áp lực tuân thủ khổng lồ:​​ Để đáp ứng các yêu cầu quản lý như Luật An toàn Dữ liệu, Hướng dẫn phân cấp an toàn dữ liệu tài chính của Ngân hàng Nhà nước, cần đầu tư nhiều nhân lực để phân loại, phân cấp dữ liệu và kiểm toán an ninh, chi phí cao và hiệu quả thấp.

Nếu bạn đang tìm kiếm giải pháp để xây dựng hệ thống quản trị dữ liệu đáp ứng yêu cầu quản lý tài chính, thì giải pháp quản trị dữ liệu cấp tài chính của Alibaba Cloud dựa trên DataWorks và Trung tâm An ninh Dữ liệu (DSC) sẽ cung cấp cho bạn một con đường rõ ràng và hiệu quả.​

Sơ đồ kiến trúc và tổng quan giải pháp

Dưới đây minh họa kiến trúc tổng thể và mối quan hệ luân chuyển dữ liệu của quản trị dữ liệu được xây dựng dựa trên Alibaba Cloud DataWorks và DSC:

Giải pháp quản trị dữ liệu cấp tài chính: Xây dựng hệ thống kiểm soát dòng dữ liệu và chất lượng dữ liệu cấp doanh nghiệp - LikaCloud

Tư tưởng thiết kế cốt lõi của giải pháp này là"Quản trị là quy trình, bảo mật là tích hợp sẵn", quy trình làm việc (Workflow) như sau:

  1. 1.​Tiếp nhận và phát triển dữ liệu:Thông quaDataWorksMô-đun tích hợp dữ liệu, đồng bộ hóa các nguồn dữ liệu phân tán (RDS, MaxCompute, OSS, v.v.) vào kho dữ liệu, và hoàn thành việc cấu hình và lập lịch các tác vụ xử lý dữ liệu thông qua giao diện phát triển trực quan.
  2. 2.​Phát hiện quan hệ dòng dữ liệu tự động:DataWorks tự động phân tích các tác vụ xử lý dữ liệu (SQL, ETL, v.v.), tạo rasơ đồ quan hệ dòng dữ liệu từ đầu đến cuối từ nguồn dữ liệu đến báo cáo cuối cùngvà hiển thị trên bản đồ dữ liệu.
  3. 3.Nhận dạng và phân loại dữ liệu nhạy cảm:​​ ​Trung tâm An toàn Dữ liệu (DSC)​​ Sử dụng mẫu ngành tài chính tích hợp sẵn và thuật toán học máy, tự động quét, phát hiện và phân loại dữ liệu nhạy cảm (như thông tin PII khách hàng, thông tin giao dịch, v.v.) và gắn nhãn phân loại cấp độ.
  4. 4.Kiểm tra và giám sát chất lượng:Cấu hình quy tắc giám sát chất lượng dữ liệu trong DataWorks, kiểm tra tính kịp thời, đầy đủ và chính xác của các bảng dữ liệu quan trọng, tự động cảnh báo và chặn các tác vụ hạ nguồn khi phát hiện vấn đề, đảm bảo chất lượng đầu ra dữ liệu.
  5. 5.Quản lý tài sản thống nhất và kiểm soát an ninh:Tất cả siêu dữ liệu, dòng dữ liệu, điểm chất lượng và nhãn bảo mật được tập hợp thành danh mục tài sản dữ liệu thống nhất của doanh nghiệp. Dựa trên kết quả nhận diện rủi ro từ DSC và nhật ký kiểm toán, xây dựng và thực thi chính sách bảo mật dữ liệu thống nhất (như ẩn danh hóa, kiểm soát truy cập).

Giá trị cốt lõi của kiến trúc này nằm ở:​​ Nó chuyển đổi các khâu trọng tâm của quản trị dữ liệu (siêu dữ liệu, chất lượng dữ liệu, an toàn dữ liệu) từ mô hình thủ công, thụ động, biệt lập truyền thống sang một hệ thống hợp tác tự động hóa, chủ động, được kết nối xuyên suốt toàn bộ quy trình, biến dữ liệu thực sự trở thành tài sản chiến lược đáng tin cậy, kiểm soát được và sẵn sàng sử dụng.

Giải thích chi tiết về sản phẩm cốt lõi và thành phần

Tên thành phầnVai trò đảm nhậnĐề xuất cấu hình/lựa chọn chínhTại sao chọn nó
Nền tảng phát triển và quản trị dữ liệu lớn​
DataWorks
Nền tảng cốt lõi cho phát triển và quản trị dữ liệuCung cấp các chức năng toàn diện như tích hợp dữ liệu, phát triển dữ liệu, chất lượng dữ liệu, bản đồ dữ liệu, dịch vụ dữ liệu, là nền tảng chính để triển khai quy trình quản trị dữ liệu.- ​Lựa chọn phiên bản:Các doanh nghiệp tài chính nên chọn phiên bản doanh nghiệp để đáp ứng các yêu cầu về hiệu suất và bảo mật cao hơn.
- ​Chất lượng dữ liệu:Cấu hình quy tắc về tính toàn vẹn, tính duy nhất và tính chính xác cho các chỉ số kinh doanh cốt lõi và bảng, đồng thời thiết lập ngưỡng chặn.
- ​Bản đồ dữ liệu:Kích hoạt phân tích dòng dữ liệu tự động, bảo trì định kỳ mô tả tài sản và thông tin Chủ sở hữu.
Nó tích hợp liền mạch quy trình sản xuất dữ liệu với quản trị dữ liệu, tránh được vấn đề "hai mặt" giữa quản trị và phát triển. Khả năng phát hiện dòng dữ liệu tự động của nó vượt xa các công cụ mã nguồn mở, giảm đáng kể chi phí vận hành.
Trung tâm An toàn Dữ liệu (DSC)​Động cơ cốt lõi của quản trị an ninh dữ liệuChịu trách nhiệm phát hiện dữ liệu nhạy cảm tự động, phân loại phân cấp, phát hiện rủi ro, kiểm toán và ẩn danh hóa, là nền tảng công nghệ của quản trị an ninh dữ liệu.- ​Phạm vi quét:Cấu hình tác vụ quét định kỳ cho kho dữ liệu cốt lõi (như MaxCompute), cơ sở dữ liệu (RDS).
- ​Nhận diện mẫu:​​ Lựa chọn và tùy chỉnh mẫu ngành tài chính, nhận diện chính xác thông tin nhạy cảm như CMND, thẻ ngân hàng, số điện thoại.
- ​Mô hình rủi ro:​​ Kích hoạt mô hình phát hiện rủi ro như truy cập bất thường, thao tác tần suất cao.
Nó tận dụng công nghệ máy học, giải quyết vấn đề khó khăn về việc "không tìm thấy" thông tin nhạy cảm trong khối lượng dữ liệu khổng lồ. Tích hợp sâu với các sản phẩm như DataWorks, MaxCompute, thực hiện việc triển khai thống nhất các chính sách bảo mật.
Dịch vụ tính toán dữ liệu lớn gốc đám mây MaxComputeCông cụ tính toán dữ liệu lớn. Là kho dữ liệu cấp doanh nghiệp, lưu trữ và xử lý toàn bộ dữ liệu, là đối tượng và phương tiện chính của quản trị dữ liệu.- ​Lập kế hoạch tài nguyên: ​​ Mua CU trả trước hoặc sử dụng thanh toán theo lượng dựa trên khối lượng dữ liệu và dự kiến phát triển.
- ​Vòng đời dữ liệu: ​​ Thiết lập chiến lược lưu trữ phân lớp dữ liệu và quản lý vòng đời hợp lý để tối ưu hóa chi phí.
Cung cấp khả năng lưu trữ EB cấp và tính toán hiệu suất cao, được quản lý hoàn toàn, ổn định và đáng tin cậy, là nền tảng xây dựng kho dữ liệu doanh nghiệp. Tích hợp liền mạch tự nhiên với DataWorks.
Nền tảng dịch vụ tính toán bảo mật Ant GroupNền tảng tính toán tăng cường quyền riêng tư(Tùy chọn). Trong các tình huống cần hợp tác dữ liệu nhưng không muốn dữ liệu gốc ra khỏi miền, cung cấp khả năng tính toán hợp nhất dữ liệu an toàn và đáng tin cậy.- ​Trường hợp sử dụng:​​ Áp dụng cho các kịch bản kinh doanh cần hợp tác dữ liệu với tổ chức bên ngoài như tiếp thị liên kết, quản lý rủi ro liên kết, v.v.Trong điều kiện đáp ứng yêu cầu về an toàn và tuân thủ dữ liệu, mở khóa giá trị dữ liệu, đạt được "dữ liệu có thể sử dụng nhưng không thể nhìn thấy", là hình thức cao cấp của quản trị dữ liệu.

Tổng kết ưu điểm của giải pháp

  • ? Toàn bộ đường dẫn dữ liệu:​Tự động phân tích và tạo sơ đồ mối quan hệ dữ liệu ở cấp độ trường, hỗ trợ phân tích tác động và truy nguyên nguồn gốc, mạch dữ liệu rõ ràng ngay trước mắt.
  • ✅ Kiểm tra chất lượng dữ liệu chủ động:Cung cấp giám sát quy tắc mạnh mẽ và cảnh báo thông minh, chuyển từ khắc phục sau sự cố sang phòng ngừa trước, đảm bảo dữ liệu chính xác và đáng tin cậy.
  • ?️ Bảo vệ dữ liệu nhạy cảm thông minh:Phát hiện và phân loại dữ liệu nhạy cảm tự động dựa trên ML, kết hợp với kiểm soát truy cập chính xác và chiến lược ẩn danh hóa, đáp ứng yêu cầu tuân thủ tài chính.
  • Thống nhất hiểu biết về giá trị tài sản:Xây dựng danh mục tài sản dữ liệu thống nhất cho doanh nghiệp, tập hợp thông tin như siêu dữ liệu, điểm chất lượng, nhãn bảo mật, mức độ phổ biến, tài sản dữ liệu rõ ràng ngay trước mắt.
  • Tự động hóa quy trình quản trị:Nhúng các quy tắc quản trị (như quy tắc chất lượng, chính sách an toàn) vào quy trình phát triển, thực hiện "dịch chuyển quản trị sang trái", nâng cao hiệu quả, giảm chi phí nhân công.

Kịch bản ứng dụng và khách hàng phù hợp

Giải pháp này rất phù hợp với các kịch bản kinh doanh và khách hàng sau:

  • Ứng dụng thực tế:​
    • Đáp ứng tuân thủ quy định:Đáp ứng yêu cầu kiểm toán của cơ quan quản lý ngành tài chính về an toàn dữ liệu, chất lượng dữ liệu, nguồn gốc dữ liệu.
    • Nâng cao chất lượng dữ liệu:Giải quyết các vấn đề lâu dài như dữ liệu không nhất quán, không chính xác, không kịp thời ảnh hưởng đến hoạt động kinh doanh, nâng cao hiệu quả ra quyết định.
    • Xây dựng an ninh dữ liệu:Xây dựng hệ thống bảo vệ an ninh dữ liệu doanh nghiệp, ngăn chặn rò rỉ dữ liệu nhạy cảm, bảo vệ quyền riêng tư của khách hàng.
    • Tài sản hóa dữ liệu:Tổ chức và khai thác tài sản dữ liệu doanh nghiệp, nâng cao hiệu quả tìm kiếm, hiểu và sử dụng dữ liệu.
  • Đối tượng khách hàng áp dụng:
    • Các tổ chức tài chính như ngân hàng, chứng khoán, bảo hiểm:Ngành công nghiệp chịu sự giám sát chặt chẽ, có nhu cầu bắt buộc về quản trị dữ liệu.
    • Các tập đoàn doanh nghiệp lớn:Hệ thống phức tạp, nhiều nền tảng, dữ liệu hỗn loạn, cấp thiết cần quản trị thống nhất.
    • Các doanh nghiệp internet có độ nhạy dữ liệu cao:Chẳng hạn như thương mại điện tử, nền tảng mạng xã hội, sở hữu lượng lớn dữ liệu người dùng, cần kiểm soát chặt chẽ.

Các liên kết có liên quan