Datenmanagement

Ohne Daten keine Informationen, und ohne Informationen keine wissensbasierten Entscheide! – aber nur, wenn Daten so aufgearbeitet werden, dass die relevante Information den Anwendern tatsächlich auch verfügbar sind. Mit Data-management von Numerics können Unternehmen das Nutzungspotential von Rohdaten für BI maximal ausschöpfen. Von Rohdaten zu einem abfragefähigen und verwertbaren Datawarehouse ist ein langer Weg – Quelldaten von verschiedenen – und in der Regel heterogenen – operativen Systemen (i.e. legacy systems) werden mit verschiedenen Techniken in einheitliches Repositorium überführt. Numerics strukturiert dieses Repositorium so, damit es für die Abfrage- und Reporting Bedürfnisse der Anwender tatsächlich auch nutzbar ist. Dabei können Daten nach verschiedenen Hierarchien (wie Zeit, Ort und Produktkategorie) aggregiert werden. Die verschiedenen Techniken von Numerics führen heterogene Rohdaten in ein einheitliches benutzergerechtes Datenformat zusammen. In der komplexen Prozesskette spielt die Datenqualität eine entscheidende Rolle; Numerics entwickelt und implementiert Regeln für Erfassung, Bearbeitung und Auswertung der Daten.

Basis für Analysen sind relationale Datenbankmodelle, die Informationen in logischen und effizienten Struktur anlegen. Modulare Ansätze sparen Ressourcen an Zeit und Kosten. Im BI-Zusammenhang ist ein Data Warehouse ein Zusammenzug aller Transaktionsdaten – spezifisch strukturiert für Abfrage und Reporting und spezifisch nutzbar für alle BenutzerInnen des ganzen Unternehmen hinweg. Spezifische ‚Datamarts‘ können innerhalb eines Datawarehouse (DW) definiert werden, um den unterschiedlichen Auswertungsfragen zu genügen. Wie Daten abgelegt werden, hängt von den Bedürfnissen der Benutzer ab – beispielsweise als normalisierte relationale Tabellen oder multidimensional als Cubes.

Für klinische Studien nutzt Numerics web-basierte Werkzeuge, die auf einen HTTPS Server rund um die Uhr für unsere Kunden zur Verfügung stehen. Diese eingesetzte Software entspricht den Anforderungen der Direktive 21 CFR part 11. Nach Bedarf können massgeschneiderte Eingabemasken erstellt werden. Die Vorteile von EDC (Electronic data capture): Daten werden bereits bei der Erfassung geprüft, ad hoc Auswertungen von Patienten sind jederzeit möglich.

ETL steht für Extraktion, Transformation und Laden von Daten. ETL deckt den Prozess des Datentransfers  von den Quelldaten von operativen Systemen (i.e. legacy systems) zu einem uniformen Metadata-Repositorium. Mit konsistenten und transparenten Daten kann eine Gesamtschau auf das ganze Unternehmen realisiert werden. Um den BenutzerInnen die transformierten Daten tagsüber zur Verfügung zu stellen, laufen ETL-Prozesse meist in der Nacht, und entsprechend ist Performanz ein wesentliches Kriterium.

ETL-Systeme stellen hohen Anforderungen an Qualität, Stabilität und Skalierbarkeit. Dies schliesst Technologien um Datenqualität, Datensicherheit und Zuverlässigkeit mit ein, ebenso die Verarbeitungskette des gesamten IT-Systems.

Daten müssen kondensiert, aggregiert und angereichert werden, damit sie die Beantwortung von komplexen Fragen ermöglichen. Beispiel: Um die Anzahl “Arztbesuche pro Monat” oder die Anzahl “Verkäufe pro Woche” abzuleiten, müssen Records einer operativer Datenbank zuerst verarbeitet werden. Oft müssen dabei Daten von hetereogenen Datenbanken in ein einheitliches Format transformiert werden. Wenn repetitive Analysen mit verschiedenen Selektionsparametern durchgeführt werden, realisiert Numerics mit Macro Programmen parametrisierbare Prozesse. Numerics hat eine langjährige Erfahrung mit SAS-Programmierung und unterstützt Sie kompetent bei diesen verschiedenen Aufgaben.