Wat is datastroom in Hadoop?
Wat is datastroom in Hadoop?

Video: Wat is datastroom in Hadoop?

Video: Wat is datastroom in Hadoop?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, Mei
Anonim

Hadoop-stroom . Hadoop-stroom is 'n nut wat saam met die Hadoop verspreiding. Die nut laat jou toe om Map/Reduce-take te skep en uit te voer met enige uitvoerbare of skrip as die karteerder en/of die verkleiner.

Om ook te weet, is wat stroom in Hadoop?

Hadoop-stroom is 'n generiese API wat dit moontlik maak om Mappers en Reduces in enige taal te skryf. Maar die basiese konsep bly dieselfde. Kaartmakers en verkleiners ontvang hul insette en uitvoer op stdin en stdout as (sleutel, waarde) pare. Apache Hadoop gebruike strome soos per UNIX-standaard tussen jou aansoek en Hadoop stelsel.

wat is bondel- en stroomdata? A joernaal is 'n versameling van data punte wat binne 'n spesifieke tydsinterval saamgegroepeer is. Nog 'n term wat dikwels hiervoor gebruik word, is 'n venster van data . Stroom verwerking handel oor deurlopende data en is die sleutel om groot te word data vinnig in data.

Net so, wat word bedoel met stroomdata?

Stroom data is data wat voortdurend deur verskillende bronne gegenereer word. Sulke data moet inkrementeel verwerk word deur Stroom Verwerkingstegnieke sonder om toegang tot al die data . Dit word gewoonlik in die konteks van groot gebruik data waarin dit teen hoë spoed deur baie verskillende bronne gegenereer word.

Waar is Hadoop-stroompot?

Die Hadoop-stroomfles is steeds beskikbaar in die jongste weergawe van EMR Hadoop . Begin met EMR-vrystelling 4.0. 0 dit kan gevind word by /usr/lib/ hadoop - kaart verminder / hadoop - stroom.

Aanbeveel: