Statistisko datu apkopošana un aprēķināšana vidējā lieluma iegūšanai bieži ir ilgs un nogurdinošs process. T-tests un vienvirziena dispersijas analīze (ANOVA) ir divi visizplatītākie testi, ko izmanto šim nolūkam.
T-tests ir statistiskas hipotēzes tests, kurā testa statistika seko Studenta t sadalījumam, ja tiek atbalstīta nulles hipotēze. Šo testu piemēro, ja testa statistika seko normālam sadalījumam un ir zināma mēroga termina vērtība testa statistikā. Ja mērogošanas termins nav zināms, to aizvieto ar aprēķinu, kura pamatā ir pieejamie dati. Pārbaudes statistika sekos Studenta t sadalījumam.
Viljams Sealijs Gossets 1908. gadā ieviesa t-statistiku. Gosset bija ķīmiķis Ginesa alus darītavai Dublinā, Īrijā. Ginesa alus darītavā bija politika pieņemt darbā labākos absolventus no Oksfordas un Kembridžas, izvēloties tos, kuri varētu piedāvāt bioķīmijas un statistikas pielietojumus uzņēmuma izveidotajos rūpniecības procesos. Viljams Sealijs Gossets bija viens no šādiem absolventiem. Šajā procesā Viljams Sealijs Gossets izstrādāja t-testu, kas sākotnēji tika iecerēts kā veids, kā rentabli uzraudzīt resno (tumšā alus, kuru alus darītava ražo) kvalitāti. Gosset publicēja testu ar pildspalvu ar nosaukumu “Students” Biometrikā, aptuveni 1908. gadā. Iemesls vārda vārda nosaukšanai bija Ginesa uzstājība, jo uzņēmums vēlējās saglabāt savu politiku statistikas izmantošanā kā daļu no “komercnoslēpumiem”..
T-testa statistikai parasti ir forma T = Z / s, kur Z un s ir datu funkcijas. Z mainīgais lielums ir paredzēts jutīgai pret alternatīvo hipotēzi; faktiski Z mainīgā lielums ir lielāks, ja alternatīvā hipotēze ir patiesa. Tikmēr “s” ir mērogošanas parametrs, kas ļauj noteikt T sadalījumu. T-testa pamatā esošie pieņēmumi ir šādi: a) Z seko parastajam normālajam sadalījumam saskaņā ar nulles hipotēzi; b) ps2 seko Ï ‡ 2 sadalījumam ar p brīvības pakāpēm saskaņā ar nulles hipotēzi (kur p ir pozitīva konstante); un c) Z vērtība un s vērtība ir neatkarīgas. Konkrētā t-testa tipa gadījumā šie apstākļi ir pētāmās populācijas sekas, kā arī veids, kādā tiek ņemti dati.
No otras puses, dispersijas analīze (ANOVA) ir statistisko modeļu kolekcija. Lai gan ANOVA principus pētnieki un statistiķi izmanto jau ilgu laiku, tikai 1918. gadā sers Ronalds Fišers izstrādāja priekšlikumu formalizēt dispersijas analīzi rakstā ar nosaukumu “Korelācija starp radiniekiem par Mendeļu mantojuma pieņēmumu”. . Kopš tā laika ANOVA ir paplašināta tās darbības jomā un piemērošanā. ANOVA faktiski ir nepareizs izgudrojums, jo tas nav iegūts no dispersiju atšķirībām, bet drīzāk no atšķirībām starp grupu līdzekļiem. Tas ietver saistītās procedūras, kurās novērotā dispersija noteiktā mainīgajā tiek sadalīta komponentos, kas attiecināmi uz dažādiem variācijas avotiem.
Būtībā ANOVA nodrošina statistisko testu, lai noteiktu, vai visu grupu vidējie rādītāji ir vienādi, un rezultātā t-testu vispārina vairāk nekā divās grupās. ANOVA var būt noderīgāka par divu paraugu t-testu, jo tai ir mazāka iespēja izdarīt I tipa kļūdu. Piemēram, ja ir vairāki divu paraugu t-testi, vidējās vērtības iegūšanai ir lielāka iespēja pieļaut kļūdu nekā ANOVA ar tiem pašiem iesaistītajiem mainīgajiem. Modelis ir vienāds, un testa statistika ir F attiecība. Vienkāršoti izsakoties, t-testi ir tikai īpašs ANOVA gadījums: veicot ANOVA, vienāds rezultāts būs vairākiem t-testiem. Pastāv trīs ANOVA modeļu klases: a) fiksētu efektu modeļi, kas pieņem, ka dati nāk no parastām populācijām, atšķiras tikai pēc to līdzekļiem; b) izlases efektu modeļi, kas pieņem, ka dati apraksta dažādu populāciju hierarhiju, kuru atšķirības ierobežo hierarhija; un c) jauktu efektu modeļi, kas ir situācijās, kad ir gan fiksētie, gan nejaušie efekti.