Wat is DistCp in Hadoop?
Wat is DistCp in Hadoop?

Video: Wat is DistCp in Hadoop?

Video: Wat is DistCp in Hadoop?
Video: Hadoop Day to Day Operations - Distcp - Data back ups and migration 2024, Mei
Anonim

DistCp (verspreide kopie) is 'n instrument wat gebruik word vir groot inter/intra-kluster kopiëring. Dit gebruik KaartVerminder om die verspreiding, fouthantering en herstel daarvan, en verslagdoening te bewerkstellig. Dit brei 'n lys van lêers en gidse uit na invoer na kaarttake, wat elkeen 'n partisie van die lêers wat in die bronnelys gespesifiseer is, sal kopieer.

Net so kan 'n mens vra, oorskryf Distcp?

Ek moet ook 'n paar uitbrei en dit verduidelik discp - oorskryf sal oorskryf die lêer maak nie saak of die grootte ooreenstem of nie. Dit sal alle lêers in hdfs-nn2 wat nie in grootte ooreenstem nie vanaf hdfs-nn1 opdateer, asook enige vreemde lêers uitvee.

Net so, wat is Hadoop FS-opdrag? Die lêerstelsel ( FS ) dop sluit verskeie dop-agtige bevele wat direk in wisselwerking met die Hadoop Verspreide lêerstelsel ( HDFS ) sowel as ander lêerstelsels wat Hadoop ondersteun, soos Plaaslik FS , HFTP FS , S3 FS , en ander.

Op hierdie manier, hoe dra ek data oor van een HDF's na 'n ander HDF's?

Hadoop fs cp - Maklikste manier om data van een af te kopieer brongids na 'n ander . Gebruik die hadoop fs -cp [bron] [bestemming]. Hadoop fs copyFromLocal – Moet kopieer data van plaaslike lêerstelsel na HDFS ? Gebruik die hadoop fs -copyFromLocal [bron] [bestemming].

Hoe kopieer ek 'n kluster van een cluster na 'n ander?

Kopieer lêers tussen trosse . Jy kan kopieer lêers of dopgehou tussen verskillende trosse deur die hadoop distcp-opdrag te gebruik. Jy moet 'n geloofsbriewe insluit lêer in jou kopieer versoek so die bron cluster kan bevestig dat jy aan die bron geverifieer is cluster en die teiken cluster.

Aanbeveel: