Kan Spark plaaslike lêers lees?
Kan Spark plaaslike lêers lees?

Video: Kan Spark plaaslike lêers lees?

Video: Kan Spark plaaslike lêers lees?
Video: Apache Spark Учебник для начинающих | apache Учебное пособие по ... 2024, Mei
Anonim

Terwyl Vonk ondersteun laai lêers van die plaaslike lêerstelsel, vereis dit dat die lêers is beskikbaar op dieselfde pad op alle nodusse in jou groepering. Sommige netwerklêerstelsels, soos NFS, AFS en MapR se NFS-laag, word as 'n gewone lêerstelsel aan die gebruiker blootgestel.

Vervolgens kan 'n mens ook vra, hoe laat ek vonk in die plaaslike modus?

In plaaslike modus , vonk werksgeleenthede hardloop op 'n enkele masjien, en word parallel uitgevoer met behulp van multi-threading: dit beperk parallelisme tot (hoogstens) die aantal kerne in jou masjien. Om hardloop werksgeleenthede in plaaslike modus , moet jy eers 'n masjien bespreek deur SLURM in interaktiewe wyse en meld daarby aan.

Behalwe hierbo, wat is SC textFile? tekslêer is 'n metode van 'n org. apache. SparkContext klas wat lees a tekslêer van HDFS, 'n plaaslike lêerstelsel (beskikbaar op alle nodusse), of enige Hadoop-ondersteunde lêerstelsel-URI, en stuur dit terug as 'n RDD van Strings.

Wat is 'n vonklêer in hierdie verband?

Die Vonk lêer is 'n dokument waar jy al jou kreatiewe goedheid bewaar. Dit is gedefinieer deur die skrywer Stephen Johnson. So in plaas daarvan om in die middel van die nag notas op 'n Post-it® af te krap of verskillende joernale vir idees te wy, plaas jy al jou konsepte in een lêer.

Wat is parallelle versamelingsvonk?

Ons beskryf later bewerkings op verspreide datastelle. Geparalleliseerde versamelings word geskep deur JavaSparkContext's te roep paralleliseer metode op 'n bestaande Versameling in jou bestuurderprogram. Die elemente van die versameling word gekopieer om 'n verspreide datastel te vorm wat in parallel bedryf kan word.

Aanbeveel: