Wat is parketdataformaat?
Wat is parketdataformaat?

Video: Wat is parketdataformaat?

Video: Wat is parketdataformaat?
Video: An introduction to Apache Parquet 2024, November
Anonim

Apache Parket is 'n gratis en oopbron-kolomgeoriënteerde data berging formaat van die Apache Hadoop-ekosisteem. Dit is versoenbaar met die meeste van die data verwerkingsraamwerke in die Hadoop-omgewing. Dit bied doeltreffende data kompressie- en enkoderingskemas met verbeterde werkverrigting om kompleks te hanteer data in grootmaat.

Eenvoudig so, wat is die parketlêerformaat?

Parket , 'n oopbron lêerformaat vir Hadoop. Parket stoor geneste datastrukture in 'n plat kolom formaat . In vergelyking met 'n tradisionele benadering waar data in 'n ry-georiënteerde benadering gestoor word, parket is meer doeltreffend in terme van berging en werkverrigting.

Verder, waarvoor word parket gebruik? Parket is 'n oopbron-lêerformaat beskikbaar vir enige projek in die Hadoop-ekosisteem. Apache Parket is ontwerp vir doeltreffende sowel as presterende plat kolomme bergingsformaat van data in vergelyking met rygebaseerde lêers soos CSV- of TSV-lêers.

Boonop, hoe stoor parketformaat data?

DATA BLOK Elke blok in die parket lêer is gestoor word in die vorm van rygroepe. Dus, data in a parket lêer is verdeel in verskeie rygroepe. Hierdie rygroepe bestaan weer uit een of meer kolomstukke wat ooreenstem met 'n kolom in die data stel. Die data vir elke kolom stuk geskryf in die vorm van bladsye.

Is parket mens leesbaar?

ORC, Parket , en Avro is ook masjien- leesbaar binêre formate, wat wil sê dat die lêers soos brabbeltaal lyk mense . As jy nodig het 'n mens - leesbaar formaat soos JSON of XML, dan moet jy waarskynlik weer oorweeg hoekom jy Hadoop in die eerste plek gebruik.

Aanbeveel: