はじめに(ペインポイント分析)
金融企業のCTO、データディレクター、アーキテクトの皆さん、デジタルトランスフォーメーションの波の中で、次のような疑問に深く悩まされてはいないだろうか。
- データ血統のブラックホール規制要件が特定のレポートのデータソースを追跡する場合、「データがどこから来て、それに何が行われたか」という質問に迅速かつ明確に答えることができないまま、手作業でデータを分類するのに何日もかかる。
- データの質が心配だ。主要なビジネス指標は、異なるシステムで一貫性のないデータを持っており、汚れたデータや重複したデータは、リスクコントロールの意思決定やビジネスレポートの精度に深刻な影響を与えるが、効果的なモニタリングや監査ツールが不足している。
- 機密データは手に負えない。顧客ID番号や銀行カード番号などの機密情報があちこちに散らばっており、誰がどのようにアクセスしているのかがまったく不透明で、膨大なコンプライアンスリスクと漏洩の危険にさらされている。
- コンプライアンスのプレッシャーは非常に大きい。データ・セキュリティー法や中国銀行の金融データ・セキュリティー分類ガイドラインなどの規制要件を満たすには、データの分類や等級付け、セキュリティー監査に大量の人手を投入する必要があり、コストがかかり非効率的だ。
金融規制要件を満たすデータガバナンスシステムを構築するソリューションをお探しなら、DataWorksとData Security Centre(DSC)を基盤とするアリユンの金融グレードのデータガバナンスソリューションが、明確で効率的な道筋を提供します。
解决方案架构图与概述
次の図は、AliCloud DataWorksとDSCに基づいて構築されたデータガバナンスの全体的なアーキテクチャとデータフローの関係を示しています:

このプログラムの核となる設計思想は以下の通りである。「プロセスとしてのガバナンス、ビルトインとしてのセキュリティワークフローは以下の通り:
- 1.データアクセスと開発。とおすデータワークスデータ統合モジュールは、分散したデータソース(RDS、MaxCompute、OSSなど)をデータウェアハウスに同期し、ビジュアルな開発インターフェースを通じてデータ処理タスクの構成とスケジューリングを完了します。
- 2.自動血液発見。DataWorksは、データ処理タスク(SQL、ETLなど)を自動的に解析し、データソースから最終レポートまでのデータを生成します。エンド・ツー・エンドのデータ・リネージ・マッピングそしてデータマップに表示される。
- 3.機密データの識別と分類。 データ・セキュリティ・センター(DSC)金融業界のテンプレートと機械学習アルゴリズムが組み込まれているため、機密データ(顧客のPII情報、取引情報など)は自動的にスキャン、発見、分類され、分類階層でタグ付けされます。
- 4.品質監査とモニタリングDataWorksでデータ品質監視ルールを設定し、主要なデータテーブルの適時性、完全性、正確性を検証し、問題が発生した場合は自動的に警告を発し、下流タスクをブロックすることで、データ出力の品質を保証します。
- 5.統一された資産管理とセキュリティ管理。すべてのメタデータ、血統、品質スコア、セキュリティラベルは、統一された企業データ資産カタログに集約されます。統一されたデータ・セキュリティ・ポリシー(例:減感作、アクセス制御)は、DSCからのリスク識別結果と監査ログに基づいて策定され、実施される。
建築の価値提案はこうだ。データガバナンスの核となるリンク(メタデータ、データ品質、データセキュリティ)を、従来の手作業による受動的で孤立したモードから、自動化されたプロアクティブな協調システムへと変換し、チェーン全体をオープンにすることで、データが真に信頼でき、管理可能で、使用可能な戦略的資産となるようにする。
核心产品与组件详解
| コンポーネントの名称 | 役を演じる | 关键配置/选型建议 | なぜそれを選んだのですか? |
|---|---|---|---|
| ビッグデータ開発ガバナンス・プラットフォーム データワークス | データ開発とガバナンスのコア・プラットフォーム.データ統合、データ開発、データ品質、データマッピング、データサービスなどの機能をワンストップで提供し、データガバナンスプロセスの主要なホストプラットフォームとなる。 | -バージョン選択。金融企業は、より高いパフォーマンスとセキュリティ要件を満たすために、エンタープライズ・エディションを選択することをお勧めします。 -データの質。整合性、一意性、正確性のルールを構成し、コア・ビジネス・メトリクスとテーブルのブロックしきい値を設定します。 -データマップ。血統の自動解決を可能にし、資産の説明と所有者情報を定期的に管理します。 | データ生産とデータガバナンスプロセスをシームレスに統合し、ガバナンスと開発の "二枚看板 "の問題を回避する。血統の自動発見機能はオープンソースツールをはるかに凌ぎ、運用・保守コストを大幅に削減する。 |
| データ・セキュリティ・センター(DSC) | データ・セキュリティ・ガバナンス・コア・エンジン..自動化された機密データの発見、分類、等級付け、リスク検出、監査、減感作を担当し、データセキュリティガバナンスの技術的礎石となります。 | -スキャン範囲。コアデータウェアハウス(MaxComputeなど)、データベース(RDS)に対する定期的なスキャンタスクを構成する。 -テンプレートを特定する。金融業界のテンプレートを選択してカスタマイズし、IDカード、銀行カード、電話番号などの機密情報を正確に識別します。 -リスクモデリング。異常アクセス、高頻度操作などのリスク検知モデルを可能にする。 | 機械学習技術により、膨大なデータの中から機密情報を「見つけられない」という問題を解決する。DataWorksやMaxComputeなどと深く統合され、統一されたセキュリティポリシーを実現する。 |
| クラウドネイティブ・ビッグデータ・コンピューティング・サービス MaxCompute | ビッグデータ・コンピューティング・エンジン..企業レベルのデータウェアハウスとして、データの全容を保存し、計算するデータウェアハウスは、データガバナンスの主要な対象であり、手段である。 | -資源計画。プリペイドCUを購入するか、データ量と開発見込みに応じた従量課金を利用する。 -データのライフサイクル。コストを最適化するために、階層化されたデータストレージとライフサイクル管理の合理的な戦略を策定する。 | EBクラスのストレージとハイパフォーマンスコンピューティングパワーを提供し、フルマネージド、安定性、信頼性を備えたDataWorksは、エンタープライズデジタルウェアハウス構築の要です。DataWorksとのシームレスな統合を実現します。 |
| アント・プライバシー・コンピューティング・サービス・プラットフォーム | プライバシー強化されたコンピューティング・プラットフォーム(オプション)。データコラボレーションが必要だが、元のデータがドメイン外にあることが想定されないシナリオにおいて、安全で信頼性の高いデータフュージョン・コンピューティング機能を提供する。 | -使用シナリオ。共同マーケティングや共同リスク管理など、外部組織とのデータ連携を必要とするビジネスシナリオに適している。 | データセキュリティとコンプライアンス要件を満たし、「データの可用性と不可視性」を実現することを前提に、データの価値を引き出すことは、データガバナンスの高度な形態である。 |
この計画のメリットをまとめたものです。
- ? 完全なリンクデータの血統。自動化された構文解析により、フィールドレベルのデータリネージマッピングが生成され、影響分析や根本原因の追跡をサポートし、データリネージが一目瞭然になります。
- ✅ 積極的なデータ品質監査。強力なルール・モニタリングとインテリジェントな早期警告を提供し、事後対応から事前の予防に変え、正確で信頼できるデータを保証する。
- ?インテリジェントな機密データ保護。MLベースの機密データの自動検出、分類、等級付けは、正確なアクセス制御と脱感作ポリシーと組み合わされ、金融コンプライアンス要件を満たします。
- ? 資産価値の洞察を調和させる。統一されたエンタープライズ・データ資産カタログを構築し、メタデータ、品質スコア、セキュリティ・ラベル、ホットネス、その他の情報を集約することで、データ資産を一目で把握できるようにする。
- ⚙️ ガバナンス・プロセスの自動化。ガバナンス仕様(品質ルール、セキュリティ・ポリシーなど)を開発プロセスに組み込み、「ガバナンス・レフト」を実現し、効率を高め、人的コストを削減する。
应用场景与适用客户
このソリューションは、次のようなビジネス・シナリオや顧客に最適です:
- アプリケーションのシナリオ。
- 規制コンプライアンスを満たす。データ・セキュリティ、データ品質、データ血統に関する金融業界規制当局の監査要件を満たす。
- データ品質の向上。長い間ビジネスを苦しめてきた、一貫性のない、不正確で適時でないデータの問題を解決し、意思決定の効率を向上させる。
- データ・セキュリティ・ビル機密データの漏洩を防ぎ、顧客のプライバシーを保護するため、企業データセキュリティ保護システムを構築する。
- データ資産化。企業のデータ資産を整理して活性化し、データの検索、理解、利用の効率を向上させる。
- 該当するお客様
- 銀行、証券、保険などの金融機関。データガバナンスの必要性が厳しく規制されている業界。
- 大企業グループビジネスの複雑さ、システムの多様性、データの混乱は、早急に統一されたガバナンスを必要としている。
- データに敏感なインターネット企業。例えば、Eコマースやソーシャル・プラットフォームは、大量のユーザーデータを持つため、厳格に管理する必要がある。
関連リンク
- 製品公式サイトへのリンク。
- 無料体験リンク
- 技術チュートリアルへのリンク。
- ソリューション・リンク