Wat is 'n datameer in Hadoop?
Wat is 'n datameer in Hadoop?

Video: Wat is 'n datameer in Hadoop?

Video: Wat is 'n datameer in Hadoop?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, November
Anonim

A Hadoop datameer is 'n data bestuursplatform bestaande uit een of meer Hadoop trosse. Dit word hoofsaaklik gebruik om nie-relasionele te verwerk en te stoor data , soos loglêers, internet-klikstroomrekords, sensor data , JSON-voorwerpe, beelde en sosiale media-plasings.

In hierdie verband, wat is die verskil tussen 'n datapakhuis en 'n datameer?

Data mere en data Pakhuise word albei wyd gebruik vir die stoor van groot data , maar hulle is nie uitruilbare terme nie. A data meer is 'n groot poel van rou data , waarvoor die doel nog nie gedefinieer is nie. A datastoor is 'n bewaarplek vir gestruktureerde, gefiltreerde data wat reeds vir 'n spesifieke doel verwerk is.

Boonop, wat is 'n datameer-argitektuur? A Data Lake is 'n stoorbewaarplek wat groot hoeveelheid gestruktureerde, semi-gestruktureerde en ongestruktureerde kan stoor data . Anders as 'n hiërargiese Dataware-huis waar data is gestoor in lêers en gids, Datameer het 'n woonstel argitektuur.

Met betrekking tot hierdie, wat word bedoel met data-meer?

A data meer is 'n stoorbewaarplek wat 'n groot hoeveelheid rou bevat data in sy oorspronklike formaat totdat dit nodig is. Terwyl 'n hiërargiese data pakhuis winkels data in lêers of dopgehou, a data meer gebruik 'n plat argitektuur om te stoor data . Die term data meer word dikwels geassosieer met Hadoop-georiënteerde objekberging.

Is Elasticsearch 'n datameer?

A data meer is bloot 'n plek om jou te parkeer data totdat jy dit nodig het, en dit kan HDFS (mees algemeen), objekberging, NAS-bokse of enigiets anders insluit. Fundamenteel, Elasticsearch is 'n instrument vir indeksering data , nie vir die berging van nie data self.

Aanbeveel: