Eine Einführung in die Data Quality Services (DQS)

In diesem Blogartikel geht es um die Data Quality Services (DQS).
Folgende Themen werden in diesem Blogartikel vorgestellt:

1. Einführung in die Data Quality Services (DQS)
2. Installation
3. Schlüsselbegriffe

Einführung in Data Quality Services (DQS)

Die Data-Quality-Lösung von Data Quality Services (DQS) ermöglicht es einem Data Steward oder IT-Experten, die Qualität seiner Daten aufrechtzuerhalten und sicherzustellen, dass die Daten für die geschäftliche Nutzung geeignet sind. DQS ist eine wissensbasierte Lösung, die auf computergestützte und interaktive Weise die Integrität und Qualität Ihrer Datenquellen verwaltet. Mit DQS können Sie das Wissen über Ihre Daten ermitteln, aufbauen und verwalten. Sie können dieses Wissen dann zur Datenbereinigung, zum Abgleich und zur Profilerstellung verwenden. Sie können auch die Cloud-basierten Dienste von Referenzdatenanbietern in einem DQS-Datenqualitätsprojekt nutzen.

Installation

Die Installation ist sehr einfach und mit wenigen Klicks ist alles eingerichtet. Während der Installation werden Sie aufgefordert, ein Kennwort für den Datenbankhauptschlüssel einzugeben. Der Datenbankhauptschlüssel ist erforderlich, um die Schlüssel des Referenzdaten-Service-Providers zu verschlüsseln, die in der Datenbank DQS_MAIN gespeichert werden, wenn Sie später Referenzdaten-Provider in DQS einrichten.

ANMERKUNG:
Wenn Sie beim Versuch, eine Verbindung zu DQS herzustellen, die folgende Fehlermeldung erhalten, müssen Sie lediglich sicherstellen, dass der SQL Server-Dienst (MSSQLSERVER) ausgeführt wird -"Vorgehensweise: Starten einer Instanz von SQL Server (SQL Server Configuration Manager)".

Bei der Installation werden drei Datenbanken in der SQL Server-Instanz erstellt
DQS_MAIN: enthält gespeicherte DQS-Prozeduren, die DQS-Engine und veröffentlichte Wissensdatenbanken

1.DQS_PROJECTS: enthält die Dateninformationen zum Projekt
2.DQS_STAGING_DATA: Staging-Bereich, in dem Sie Ihre Quelldaten kopieren können, um
3.DQS-Vorgänge auszuführen, und anschließend Ihre verarbeiteten Daten exportieren

Schlüsselbegriffe

Nachfolgend finden Sie eine Liste der wichtigsten Begriffe, auf die ich bei meiner Recherche gestoßen bin …

DQS-Server: Wird über der SQL Server 2012-Datenbank installiert. enthält die drei oben genannten Datenbanken
Data Quality Client: Ermöglicht das Ausführen von Datenqualitätsvorgängen mit einem eigenständigen Tool
Datenbereinigung: Das Ändern, Entfernen oder Anreichern von Daten, die falsch oder unvollständig sind, wobei sowohl computergestützte als auch interaktive Prozesse verwendet werden
• In DQS umfasst Data Cleansing einen computergestützten Prozess, der analysiert, wie Daten mit dem Wissen in einer Wissensdatenbank übereinstimmen, und einen interaktiven Prozess, der es dem Data Steward ermöglicht, computergestützte Prozessergebnisse zu überprüfen und zu ändern, um sicherzustellen, dass die Datenbereinigung genau ist wie sie gemacht werden wollen
Knowledge Base: wissensbasierte Lösung, die Daten basierend auf Wissen analysiert, das Sie mit DQS aufbauen. Auf diese Weise können Sie Datenqualitätsprozesse erstellen, die das Wissen über Ihre Daten ständig verbessern und dabei die Qualität Ihrer Daten kontinuierlich verbessern
Datenqualitätsprojekt: schlägt Änderungen an den Quelldaten vor, basierend auf dem Wissen in der Wissensbasis
Domänenverwaltung: Ermöglicht es dem Data Steward, die Metadaten, die von der computergestützten Wissensermittlung generiert werden, interaktiv zu ändern und zu erweitern
Domäneneigenschaften: Definieren und steuern Sie die Verarbeitung, die auf die zugehörigen Werte angewendet wird
Domänenregeln: Stellt die Genauigkeit der Daten sicher. Diese reichen von einer grundlegenden Einschränkung, z. B. den möglichen Begriffen eines Zeichenfolgenwerts, bis zu einem komplexeren regulären Ausdruck, z. B. den gültigen Formen einer E-Mail-Adresse