はじめに(ペインポイント分析)

金融企業のCTO、データディレクター、アーキテクトの皆さん、デジタルトランスフォーメーションの波の中で、次のような疑問に深く悩まされてはいないだろうか。

  • データ血統のブラックホール規制要件が特定のレポートのデータソースを追跡する場合、「データがどこから来て、それに何が行われたか」という質問に迅速かつ明確に答えることができないまま、手作業でデータを分類するのに何日もかかる。
  • データの質が心配だ。主要なビジネス指標は、異なるシステムで一貫性のないデータを持っており、汚れたデータや重複したデータは、リスクコントロールの意思決定やビジネスレポートの精度に深刻な影響を与えるが、効果的なモニタリングや監査ツールが不足している。
  • 機密データは手に負えない。顧客ID番号や銀行カード番号などの機密情報があちこちに散らばっており、誰がどのようにアクセスしているのかがまったく不透明で、膨大なコンプライアンスリスクと漏洩の危険にさらされている。
  • コンプライアンスのプレッシャーは非常に大きい。データ・セキュリティー法や中国銀行の金融データ・セキュリティー分類ガイドラインなどの規制要件を満たすには、データの分類や等級付け、セキュリティー監査に大量の人手を投入する必要があり、コストがかかり非効率的だ。

金融規制要件を満たすデータガバナンスシステムを構築するソリューションをお探しなら、DataWorksとData Security Centre(DSC)を基盤とするアリユンの金融グレードのデータガバナンスソリューションが、明確で効率的な道筋を提供します。

解决方案架构图与概述

次の図は、AliCloud DataWorksとDSCに基づいて構築されたデータガバナンスの全体的なアーキテクチャとデータフローの関係を示しています:

金融グレードのデータガバナンス・ソリューション:企業レベルのデータ血流および品質管理システムの構築 - LikaCloud

このプログラムの核となる設計思想は以下の通りである。「プロセスとしてのガバナンス、ビルトインとしてのセキュリティワークフローは以下の通り:

  1. 1.データアクセスと開発。とおすデータワークスデータ統合モジュールは、分散したデータソース(RDS、MaxCompute、OSSなど)をデータウェアハウスに同期し、ビジュアルな開発インターフェースを通じてデータ処理タスクの構成とスケジューリングを完了します。
  2. 2.自動血液発見。DataWorksは、データ処理タスク(SQL、ETLなど)を自動的に解析し、データソースから最終レポートまでのデータを生成します。エンド・ツー・エンドのデータ・リネージ・マッピングそしてデータマップに表示される。
  3. 3.機密データの識別と分類。​ ​データ・セキュリティ・センター(DSC)金融業界のテンプレートと機械学習アルゴリズムが組み込まれているため、機密データ(顧客のPII情報、取引情報など)は自動的にスキャン、発見、分類され、分類階層でタグ付けされます。
  4. 4.品質監査とモニタリングDataWorksでデータ品質監視ルールを設定し、主要なデータテーブルの適時性、完全性、正確性を検証し、問題が発生した場合は自動的に警告を発し、下流タスクをブロックすることで、データ出力の品質を保証します。
  5. 5.統一された資産管理とセキュリティ管理。すべてのメタデータ、血統、品質スコア、セキュリティラベルは、統一された企業データ資産カタログに集約されます。統一されたデータ・セキュリティ・ポリシー(例:減感作、アクセス制御)は、DSCからのリスク識別結果と監査ログに基づいて策定され、実施される。

建築の価値提案はこうだ。データガバナンスの核となるリンク(メタデータ、データ品質、データセキュリティ)を、従来の手作業による受動的で孤立したモードから、自動化されたプロアクティブな協調システムへと変換し、チェーン全体をオープンにすることで、データが真に信頼でき、管理可能で、使用可能な戦略的資産となるようにする。

核心产品与组件详解

コンポーネントの名称役を演じる关键配置/选型建议なぜそれを選んだのですか?
ビッグデータ開発ガバナンス・プラットフォーム
データワークス
データ開発とガバナンスのコア・プラットフォーム.データ統合、データ開発、データ品質、データマッピング、データサービスなどの機能をワンストップで提供し、データガバナンスプロセスの主要なホストプラットフォームとなる。-バージョン選択。金融企業は、より高いパフォーマンスとセキュリティ要件を満たすために、エンタープライズ・エディションを選択することをお勧めします。
-データの質。整合性、一意性、正確性のルールを構成し、コア・ビジネス・メトリクスとテーブルのブロックしきい値を設定します。
-データマップ。血統の自動解決を可能にし、資産の説明と所有者情報を定期的に管理します。
データ生産とデータガバナンスプロセスをシームレスに統合し、ガバナンスと開発の "二枚看板 "の問題を回避する。血統の自動発見機能はオープンソースツールをはるかに凌ぎ、運用・保守コストを大幅に削減する。
データ・セキュリティ・センター(DSC)データ・セキュリティ・ガバナンス・コア・エンジン..自動化された機密データの発見、分類、等級付け、リスク検出、監査、減感作を担当し、データセキュリティガバナンスの技術的礎石となります。-スキャン範囲。コアデータウェアハウス(MaxComputeなど)、データベース(RDS)に対する定期的なスキャンタスクを構成する。
-テンプレートを特定する。金融業界のテンプレートを選択してカスタマイズし、IDカード、銀行カード、電話番号などの機密情報を正確に識別します。
-リスクモデリング。異常アクセス、高頻度操作などのリスク検知モデルを可能にする。
機械学習技術により、膨大なデータの中から機密情報を「見つけられない」という問題を解決する。DataWorksやMaxComputeなどと深く統合され、統一されたセキュリティポリシーを実現する。
クラウドネイティブ・ビッグデータ・コンピューティング・サービス MaxComputeビッグデータ・コンピューティング・エンジン..企業レベルのデータウェアハウスとして、データの全容を保存し、計算するデータウェアハウスは、データガバナンスの主要な対象であり、手段である。-資源計画。プリペイドCUを購入するか、データ量と開発見込みに応じた従量課金を利用する。
-データのライフサイクル。コストを最適化するために、階層化されたデータストレージとライフサイクル管理の合理的な戦略を策定する。
EBクラスのストレージとハイパフォーマンスコンピューティングパワーを提供し、フルマネージド、安定性、信頼性を備えたDataWorksは、エンタープライズデジタルウェアハウス構築の要です。DataWorksとのシームレスな統合を実現します。
アント・プライバシー・コンピューティング・サービス・プラットフォームプライバシー強化されたコンピューティング・プラットフォーム(オプション)。データコラボレーションが必要だが、元のデータがドメイン外にあることが想定されないシナリオにおいて、安全で信頼性の高いデータフュージョン・コンピューティング機能を提供する。-使用シナリオ。共同マーケティングや共同リスク管理など、外部組織とのデータ連携を必要とするビジネスシナリオに適している。データセキュリティとコンプライアンス要件を満たし、「データの可用性と不可視性」を実現することを前提に、データの価値を引き出すことは、データガバナンスの高度な形態である。

この計画のメリットをまとめたものです。

  • ? 完全なリンクデータの血統。自動化された構文解析により、フィールドレベルのデータリネージマッピングが生成され、影響分析や根本原因の追跡をサポートし、データリネージが一目瞭然になります。
  • ✅ 積極的なデータ品質監査。強力なルール・モニタリングとインテリジェントな早期警告を提供し、事後対応から事前の予防に変え、正確で信頼できるデータを保証する。
  • ?インテリジェントな機密データ保護。MLベースの機密データの自動検出、分類、等級付けは、正確なアクセス制御と脱感作ポリシーと組み合わされ、金融コンプライアンス要件を満たします。
  • ? 資産価値の洞察を調和させる。統一されたエンタープライズ・データ資産カタログを構築し、メタデータ、品質スコア、セキュリティ・ラベル、ホットネス、その他の情報を集約することで、データ資産を一目で把握できるようにする。
  • ⚙️ ガバナンス・プロセスの自動化。ガバナンス仕様(品質ルール、セキュリティ・ポリシーなど)を開発プロセスに組み込み、「ガバナンス・レフト」を実現し、効率を高め、人的コストを削減する。

应用场景与适用客户

このソリューションは、次のようなビジネス・シナリオや顧客に最適です:

  • アプリケーションのシナリオ。
    • 規制コンプライアンスを満たす。データ・セキュリティ、データ品質、データ血統に関する金融業界規制当局の監査要件を満たす。
    • データ品質の向上。長い間ビジネスを苦しめてきた、一貫性のない、不正確で適時でないデータの問題を解決し、意思決定の効率を向上させる。
    • データ・セキュリティ・ビル機密データの漏洩を防ぎ、顧客のプライバシーを保護するため、企業データセキュリティ保護システムを構築する。
    • データ資産化。企業のデータ資産を整理して活性化し、データの検索、理解、利用の効率を向上させる。
  • 該当するお客様
    • 銀行、証券、保険などの金融機関。データガバナンスの必要性が厳しく規制されている業界。
    • 大企業グループビジネスの複雑さ、システムの多様性、データの混乱は、早急に統一されたガバナンスを必要としている。
    • データに敏感なインターネット企業。例えば、Eコマースやソーシャル・プラットフォームは、大量のユーザーデータを持つため、厳格に管理する必要がある。

関連リンク