AWS REDSHIFT - AWS-TUTORIAL

Redshift ist ein schneller und leistungsstarker, vollständig verwalteter Data Warehouse-Dienst im Petabyte-Bereich in der Cloud.
Kunden können Redshift für nur 0,25 US-Dollar pro Stunde ohne Verpflichtungen oder Vorabkosten nutzen und für 1.000 US-Dollar pro Terabyte und Jahr auf ein Petabyte oder mehr skalieren.

OLAP

OLAP ist ein Online-Analyse-Verarbeitungssystem von der verwendet Rotverschiebung .

Beispiel für eine OLAP-Transaktion:

Angenommen, wir möchten den Nettogewinn für EMEA und Pazifik für das Digitalradio-Produkt berechnen. Dies erfordert das Abrufen einer großen Anzahl von Datensätzen. Im Folgenden sind die Unterlagen aufgeführt, die zur Berechnung eines Nettogewinns erforderlich sind:

Summe der in EMEA verkauften Radios.
Summe der im Pazifik verkauften Radios.
Stückkosten für Radio in jeder Region.
Verkaufspreis für jedes Radio
Verkaufspreis – Stückkosten

Zum Abrufen der oben angegebenen Datensätze sind komplexe Abfragen erforderlich. Data Warehousing-Datenbanken verwenden sowohl aus Datenbankperspektive als auch auf Infrastrukturebene unterschiedliche Architekturtypen.

Redshift-Konfiguration

Redshift besteht aus zwei Arten von Knoten:

Einzelner Knoten Multi-Knoten

Einzelner Knoten: Ein einzelner Knoten speichert bis zu 160 GB.

Multi-Knoten: Multi-Node ist ein Knoten, der aus mehr als einem Knoten besteht. Es gibt zwei Arten:

Lassen Sie uns das Konzept von Leader-Knoten und Rechenknoten anhand eines Beispiels verstehen.

Das Redshift-Warehouse ist eine Sammlung von Rechenressourcen, die als Knoten bezeichnet werden. Diese Knoten sind in einer Gruppe organisiert, die als Cluster bezeichnet wird. Jeder Cluster läuft in einer Redshift Engine, die eine oder mehrere Datenbanken enthält.

Wenn Sie eine Redshift-Instanz starten, beginnt diese mit einem einzelnen Knoten mit einer Größe von 160 GB. Wenn Sie wachsen möchten, können Sie zusätzliche Knoten hinzufügen, um die Vorteile der Parallelverarbeitung zu nutzen. Sie haben einen Führungsknoten, der die mehreren Knoten verwaltet. Der Leader-Knoten verwaltet die Client-Verbindung sowie die Rechenknoten. Es speichert die Daten in Rechenknoten und führt die Abfrage durch.

Warum Redshift zehnmal schneller ist

Redshift ist aus folgenden Gründen zehnmal schneller:

Redshift-Funktionen

Die Funktionen von Redshift sind unten aufgeführt:

Netzwerktopologien

TechCodeview

Was ist Redshift?

Redshift-Konfiguration

Redshift-Funktionen