Watter tipe groepering kan groot data hanteer?
Watter tipe groepering kan groot data hanteer?

Video: Watter tipe groepering kan groot data hanteer?

Video: Watter tipe groepering kan groot data hanteer?
Video: Gregory Chaitin: Complexity, Metabiology, Gödel, Cold Fusion 2024, Desember
Anonim

Hiërargies groepering kan nie groot data hanteer wel maar K Beteken groepering kan. Dit is omdat die tydskompleksiteit van K Means lineêr is, d.w.s. O(n) terwyl dié van hiërargiese groepering is kwadraties d.w.s. O(n2).

Wat dit betref, wat is groepering in groot data?

Groepering is 'n Masjienleer-tegniek wat die groepering van behels data punte. Gegee 'n stel van data punte, kan ons 'n gebruik groepering algoritme om elkeen te klassifiseer data wys na 'n spesifieke groep.

Net so, wat is groepering en die tipes daarvan? Groepering metodes word gebruik om groepe soortgelyke voorwerpe te identifiseer in 'n meerveranderlike datastelle wat versamel is uit velde soos bemarking, bio-mediese en geo-ruimtelike. Hulle is anders tipes van groepering metodes, insluitend: Partisioneringsmetodes. Hiërargies groepering . Model-gebaseer groepering.

Om ook te weet watter soort groeperingsalgoritme is beter vir baie groot datastelle?

K-Beteken wat een van die mees gebruikte is groepering metodes en K-Beteken gebaseer op MapReduce word beskou as 'n gevorderde oplossing vir baie groot datastelgroepering . Die uitvoeringstyd is egter steeds 'n struikelblok as gevolg van die toenemende aantal iterasies wanneer daar 'n toename van datastel grootte en aantal van trosse.

Waarvoor word groepering gebruik?

Groepering is 'n metode van leer sonder toesig en is 'n algemene tegniek vir statistiese data-analise gebruik in baie velde. In Data Science, kan ons gebruik groepering ontleding om waardevolle insigte uit ons data te verkry deur te sien in watter groepe die datapunte val wanneer ons 'n groepering algoritme.

Aanbeveel: