Hoe word datalokalisering in Hadoop bereik?
Hoe word datalokalisering in Hadoop bereik?

Video: Hoe word datalokalisering in Hadoop bereik?

Video: Hoe word datalokalisering in Hadoop bereik?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, April
Anonim

Data lokalisering in Hadoop . Neem die voorbeeld van Woordtelling, waar die meeste van die woorde vir 5 Lacs of meer keer herhaal is. In daardie geval na die Mapper-fase, sal elke Mapper-uitset woorde in die reeks van 5 Lacs hê. Hierdie volledige proses om Mapper-uitset na LFS te stoor, word as genoem Datalokalisering.

As u dit in die oog hou, wat is datalokalisering in Hadoop?

Die konsep van Data ligging in Hadoop Data ligging in KaartVerminder verwys na die vermoë om die berekening naby aan waar die werklike te beweeg data woon op die nodus, in plaas daarvan om groot te beweeg data tot berekening. Dit verminder netwerkopeenhoping en verhoog die algehele deurset van die stelsel.

Ook, hoe word groot data gestoor? Die meeste mense assosieer HDFS, of Hadoop Distributed File System, outomaties met Hadoop data pakhuise. HDFS stoor inligting in groepe wat uit kleiner blokke bestaan. Hierdie blokke is gestoor word in fisiese ter plaatse berging eenhede, soos interne skyfdryf.

Net so, hoe word data in Hadoop gestoor?

Op 'n Hadoop cluster, die data binne HDFS en die MapReduce-stelsel word op elke masjien in die groepering gehuisves. Data is gestoor word in data blokke op die DataNodes. HDFS herhaal dit data blokke, gewoonlik 128MB groot, en versprei dit sodat hulle binne verskeie nodusse oor die groep gerepliseer word.

Hoe word lêers in HDFS gestoor?

HDFS ontbloot a lêer stelsel naamruimte en laat gebruikersdata toe gestoor word in lêers . Intern, a lêer is verdeel in een of meer blokke en hierdie blokke is gestoor word in 'n stel DataNodes. Die NameNode word uitgevoer lêer stelselnaamruimte-bewerkings soos oopmaak, toemaak en hernoem lêers en gidse.

Aanbeveel: