store data er kompliceret, ødelagte, masser af data, betyder, at den database, kan føre til, at mange variabler, psykologiske lærde, behandling og analyse af data, er utvivlsomt en stor udfordring.i ovennævnte tilfælde, antal stikprøver er tusindvis af prøver og oplysninger, uden tvivl, udvikling af informationsteknologi, herunder psykologi, samfundsvidenskab, at bringe enorme muligheder, som effektivt overvinder de baseret på lille stikprøve, prøveudtagning data og konklusioner repræsentativitet og gyldighed.men når variabler i store mængder, dvs. høje dimension data, vil det være super, montering, falske klynge, falsk sammenhæng, kontrol af falsk positive, træk udvælgelse, begrænset problem.desuden, stikprøve, overdreven statistisk signifikant øger sandsynligheden for, at cohen mener, at set fra essensen af en psykologisk fænomen og andre psykiske fænomener, til en vis grad har relevans, betydning, måske ikke er vigtigt, men når stikprøver er stor nok, det bliver i statistisk signifikant.i store data, forskning, udtrykkeligt forskning er af afgørende betydning, og i planlægningen af forskere for denne forskning er vigtig, og den praktiske betydning er det? der er ingen virkning størrelse tærskel? er der en vis mængde varians forklaret, hvor en gruppe af variabler, som giver vigtige forklaring eller forudsigelse kraft.