Unterschied zwischen RDBMs und Hadoop

Unterschied zwischen RDBMs und Hadoop

Der Schlüsselunterschied Zwischen RDBMS und Hadoop ist das die RDBMS speichert strukturierte Daten, während der Hadoop strukturierte, halbstrukturierte und unstrukturierte Daten speichert.

Das RDBMS ist ein Datenbankverwaltungssystem, das auf dem relationalen Modell basiert. Der Hadoop ist eine Software zum Speichern von Daten und zum Ausführen von Anwendungen auf Cluster von Commodity -Hardware.

INHALT

1. Überblick und wichtiger Unterschied
2. Was ist RDBMS
3. Was ist Hadoop
4. Seite an Seitenvergleich - RDBMS gegen Hadoop in tabellarischer Form
5. Zusammenfassung

Was ist RDBMS?

RDBMS steht für das relationale Datenbankverwaltungssystem basierend auf dem relationalen Modell. In den RDBMs werden Tabellen verwendet, um Daten zu speichern, und Schlüssel und Indizes helfen dabei, die Tabellen zu verbinden. Eine Tabelle ist eine Sammlung von Datenelementen, und sie sind die Entitäten. Es enthält Zeilen und Spalten. Die Zeilen stellen einen einzelnen Eintrag in der Tabelle dar. Die Spalten repräsentieren die Attribute.

Zum Beispiel kann die Verkaufsdatenbank Kunden- und Produkteinheiten haben.  Der Kunde kann Attribute wie Customer_ID, Name, Adresse, Telefon_no haben. Das Element kann Attribute wie product_id, Name usw. haben. Der Hauptschlüssel der Kundentabelle ist Customer_ID, während der Hauptschlüssel der Produkttabelle product_id ist. Das Platzieren der product_id in der Kundentabelle als Fremdschlüssel verbindet diese beiden Entitäten. Ebenso sind die Tabellen miteinander verbunden.  Sie bieten Datenintegrität, Normalisierung und vieles mehr.  Nur wenige der gängigen RDBMs sind MySQL, MSSQL und Oracle. Sie verwenden SQL zum Abfragen.

Was ist Hadoop?

Der Hadoop ist ein Apache Open Source -Framework in Java. Es hilft, eine große Anzahl von Daten über Computercomputern hinweg mit einfachen Programmiermodellen zu speichern und zu verarbeiten. Das Hauptziel von Hadoop ist es, Big Data zu speichern und zu verarbeiten, das bezieht sich auf eine große Menge komplexer Daten. Der Durchsatz von Hadoop, der die Fähigkeit ist, ein Datenvolumen innerhalb eines bestimmten Zeitraums zu verarbeiten, ist hoch.

Es gibt vier Module in der Hadoop -Architektur. Sie sind Hadoop Common, Garn, Hadoop Distributed File System (HDFS) und Hadoop MapReduce. Das gemeinsame Modul enthält die Java -Bibliotheken und -versorgungsunternehmen. Es hat auch die Dateien, um Hadoop zu starten. Hadoop -Yarn führt die Arbeitsplanung und das Cluster -Ressourcenmanagement durch.

Darüber hinaus ist das Hadoop Distributed File System (HDFS) das Hadoop -Speichersystem. Es verwendet die Master-Slave-Architektur. Der Masterknoten ist der Namenode und verwaltet die Meta -Daten des Dateisystems. Andere Computer sind Sklavenknoten oder Datanoden. Sie speichern die tatsächlichen Daten. Andererseits führt Hadoop MapReduce die verteilte Berechnung durch. Es hat die Algorithmen, um die Daten zu verarbeiten. Im HDFS hat der Masterknoten einen Job -Tracker. Es läuft eine Karte, die Jobs auf den Sklavenknoten reduziert. Für jeden Sklavenknoten gibt es einen Task -Tracker, um die Datenverarbeitung abzuschließen und das Ergebnis zurück an den Masterknoten zu senden. Insgesamt bietet der Hadoop eine massive Speicherung von Daten mit hoher Verarbeitungsleistung.

Was ist der Unterschied zwischen RDBMS und Hadoop?

RDBMS gegen Hadoop

RDBMS ist eine Systemsoftware zum Erstellen und Verwalten von Datenbanken, die auf dem relationalen Modell basieren. Hadoop ist eine Sammlung von Open -Source -Software, die viele Computer verbindet, um Probleme mit einer großen Menge an Daten und Berechnungen zu lösen.
 Datenvielfalt
RDBMS speichert strukturierte Daten. Hadoop-Speicher strukturierte, semi-strukturierte und unstrukturierte Daten.
Datenspeicher
RDBMS speichert durchschnittliche Datenmenge. Hadoop speichert eine große Datenmenge als RDBMs.
 Geschwindigkeit
In RDBMs sind die Lesevorgänge schnell. In Hadoop sind Lese- und Schreibvorgänge schnell.
Skalierbarkeit
RDBMS hat vertikale Skalierbarkeit. Hadoop hat eine horizontale Skalierbarkeit.
Hardware
RDBMs verwenden High-End-Server. Hadoop verwendet Warenhardware.
  Durchsatz
Der RDBMS -Durchsatz ist höher. Der Hadoop -Durchsatz ist niedriger.

Zusammenfassung -RDBMS gegen Hadoop

In diesem Artikel wurde der Unterschied zwischen RDBMS und Hadoop erörtert. Der Hauptunterschied zwischen RDBMS und Hadoop besteht darin, dass die RDBMS strukturierte Daten speichern, während die Hadoop strukturierten, halbstrukturierten und unstrukturierten Daten speichern.

Referenz:

1.Tutorials Punkt. „SQL RDBMS -Konzepte.”, Tutorials Punkt, 8. Januar. 2018. Hier verfügbar  
2.Tutorials Punkt. „Hadoop -Tutorial.”, Tutorials Punkt, 8. Januar. 2018. Hier verfügbar  

Bild mit freundlicher Genehmigung:

1.'8552968000'By Intel Free Press (CC BY-SA 2.0) über Flickr