Anonim

P-vērtību teorija un nulles hipotēze sākumā varētu šķist sarežģīta, taču izpratne par jēdzieniem palīdzēs orientēties statistikas pasaulē. Diemžēl šie termini populārzinātnē bieži tiek nepareizi izmantoti, tāpēc visiem būtu noderīgi saprast pamatus.

Skatiet arī mūsu rakstu Kā izdzēst visas citas rindas programmā Excel

Aprēķināt modeļa p vērtību un nulle hipotēzi pierādīt / atspēkot ir pārsteidzoši vienkārši, izmantojot MS Excel. Ir divi veidi, kā to izdarīt, un mēs apskatīsim tos abus. Ierausim iekšā.

Nulles hipotēze un p -vērtība

Nulles hipotēze ir apgalvojums, ko dēvē arī par noklusējuma pozīciju, kurā apgalvots, ka saistība starp novērotajām parādībām neeksistē. To var izmantot arī asociācijām starp divām novērotajām grupām. Pētījuma laikā jūs pārbaudāt šo hipotēzi un mēģināt to atspēkot.

Piemēram, sakiet, ka vēlaties novērot, vai konkrētai iedoma diētai ir nozīmīgi rezultāti. Nederīga hipotēze šajā gadījumā ir tāda, ka testa subjektu svarā pirms un pēc diētas ievērojamas atšķirības nav. Alternatīva hipotēze ir tāda, ka diēta mainīja rezultātu. To mēģina pierādīt pētnieki.

P vērtība norāda iespēju, ka statistikas kopsavilkums būtu vienāds vai lielāks par novēroto vērtību, ja nulles hipotēze ir patiesa attiecībā uz noteiktu statistisko modeli. Lai arī to bieži izsaka kā decimālo skaitli, parasti ir labāk to izteikt procentos. Piemēram, p- vērtībai 0, 1 jābūt 10%.

Zema p vērtība nozīmē, ka pierādījumi pret nulles hipotēzi ir spēcīgi. Tas nozīmē arī to, ka jūsu dati ir nozīmīgi. No otras puses, augsta p vērtība nozīmē, ka nav pārliecinošu pierādījumu pret hipotēzi. Lai pierādītu, ka iedoma diēta darbojas, pētniekiem jāatrod zema p- vērtība.

Statistiski nozīmīgs rezultāts ir tāds, kas ir maz ticams, ka tas notiks, ja nulles hipotēze ir patiesa. Nozīmīguma līmenis tiek apzīmēts ar grieķu alfa burtu, un tam jābūt lielākam par p vērtību, lai rezultāts būtu statistiski nozīmīgs.

Daudzi pētnieki dažādās jomās izmanto p- vērtību, lai iegūtu labāku un dziļāku ieskatu datos, ar kuriem viņi strādā. Dažas no ievērojamām jomām ietver socioloģiju, krimināltiesības, psiholoģiju, finanses un ekonomiku.

P -vērtības atrašana programmā Excel

Datu kopas p vērtību var atrast MS Excel, izmantojot funkciju T-Test vai izmantojot datu analīzes rīku. Pirmkārt, mēs izpētīsim T-Test funkciju. Mēs pārbaudīsim piecus koledžas studentus, kuri ievēroja 30 dienu diētu. Mēs salīdzināsim viņu svaru pirms un pēc diētas.

PIEZĪME. Šī raksta vajadzībām mēs izmantosim programmu MS Excel 2010. Lai arī tā nav visjaunākā, tomēr šīs darbības parasti jāpiemēro arī jaunākajām versijām.

T-testa funkcija

Veiciet šīs darbības, lai aprēķinātu p- vērtību ar funkciju T-Test.

  1. Izveidojiet un aizpildiet tabulu. Mūsu galds izskatās šādi:

  2. Noklikšķiniet uz jebkuras šūnas ārpus tabulas.
  3. Ievadiet: = T.Test (.
  4. Pēc atvērtās iekavas ierakstiet pirmo argumentu. Šajā piemērā tā ir kolonna Pirms diētas. Diapazonam jābūt B2: B6. Līdz šim funkcija izskatās šādi: T.Test (B2: B6.
  5. Tālāk mēs ievadīsim otro argumentu. Kolonna Pēc diētas un tās rezultāti ir otrais arguments, un diapazons, kas mums nepieciešams, ir C2: C6. Pievienosim to formulai: T.Test (B2: B6, C2: C6).
  6. Pēc otrā argumenta ierakstiet komatu, un nolaižamajā izvēlnē automātiski parādīsies vienpusējās un divpusējās izplatīšanas opcijas. Atlasīsim pirmo - vienvirziena sadalījumu. Veiciet dubultklikšķi uz tā.
  7. Ievadiet citu komatu.
  8. Nākamajā nolaižamajā izvēlnē veiciet dubultklikšķi uz opcijas Pārī.
  9. Tagad, kad jums ir visi nepieciešamie elementi, aizveriet stiprinājumu. Šī piemēra formula izskatās šādi: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Nospiediet Enter. Šūnā nekavējoties parādīsies p- vērtība. Mūsu gadījumā vērtība ir 0, 133906 vai 13, 3906%.

Tā kā šī p vērtība ir augstāka par 5%, tā nesniedz pārliecinošu pierādījumu par nulles hipotēzi. Mūsu piemērā pētījumi nepierādīja, ka diētas ievērošana palīdzēja testa subjektiem zaudēt ievērojamu svara daudzumu. Tas nebūt nenozīmē, ka nulles hipotēze ir pareiza, tikai to, ka tā vēl nav atspēkota.

Datu analīzes maršruts

Datu analīzes rīks ļauj veikt daudzas atdzist lietas, ieskaitot p-vērtības aprēķinus. Lai padarītu lietas vienkāršākas, mēs izmantosim to pašu tabulu kā iepriekšējā metodē.

Lūk, kā tas tiek darīts.

  1. Tā kā mums jau ir svara atšķirības D slejā, mēs izlaidīsim starpības aprēķinu. Nākotnes tabulās izmantojiet šo formulu: = “1. šūna” - “2. šūna”.
  2. Pēc tam galvenajā izvēlnē noklikšķiniet uz cilnes Dati.
  3. Atlasiet rīku Datu analīze.
  4. Ritiniet uz leju sarakstu un noklikšķiniet uz t-Test: Paired Two Sample for Means opcijas.
  5. Noklikšķiniet uz Labi.
  6. Parādīsies uznirstošais logs. Tas izskatās šādi:

  7. Ievadiet pirmo diapazonu / argumentu. Mūsu piemērā tas ir B2: B6.
  8. Ievadiet otro diapazonu / argumentu. Šajā gadījumā tas ir C2: C6.
  9. Tekstlodziņā Alfa atstājiet noklusējuma vērtību (tā ir 0, 05).
  10. Noklikšķiniet uz radiopogas Output Range un izvēlieties vietu, kur vēlaties iegūt rezultātu. Ja tā ir A8 šūna, ierakstiet: $ A $ 8.
  11. Noklikšķiniet uz Labi.
  12. Excel aprēķinās vērtību p un vairākus citus parametrus. Fināla galds varētu izskatīties šādi:

Kā redzat, vienas astes p- vērtība ir tāda pati kā pirmajā gadījumā - 0.133905569. Tā kā tas ir virs 0, 05, uz šo tabulu attiecas nulles hipotēze, un pierādījumi pret to ir vāji.

Lietas, kas jāzina par vērtību p

Šeit ir daži noderīgi padomi par p-vērtības aprēķiniem programmā Excel.

  1. Ja p vērtība ir vienāda ar 0, 05 (5%), tabulas dati ir nozīmīgi. Ja tas ir mazāks par 0, 05 (5%), jūsu iegūtie dati ir ļoti nozīmīgi.
  2. Ja p- vērtība ir lielāka par 0, 1 (10%), tabulā norādītie dati ir nenozīmīgi. Ja tas ir diapazonā no 0, 05 līdz 0, 10, jums ir nenozīmīgi dati.
  3. Jūs varat mainīt alfa vērtību, lai gan visizplatītākās iespējas ir 0, 05 (5%) un 0, 10 (10%).
  4. Atkarībā no hipotēzes var būt labāka izvēle divpusēja pārbaude. Iepriekš minētajā piemērā vienpusēja pārbaude nozīmē, ka mēs pēta, vai testa subjekti zaudēja svaru pēc diētas ievērošanas, un tas ir tieši tas, kas mums bija nepieciešams, lai uzzinātu. Bet divpusējs tests arī pārbaudītu, vai viņi ieguva statistiski nozīmīgu svara daudzumu.
  5. P- vērtība nevar identificēt mainīgos. Citiem vārdiem sakot, ja tas identificē korelāciju, tas nevar noteikt cēloņus, kas to rada.

P -vērtība ir noteikta

Ikvienam statistiķim, kurš ir sava sāls vērts, ir jāzina nulle hipotēzes pārbaudes trūkumi un tas, ko nozīmē p- vērtība. Šīs zināšanas noderēs arī daudzu citu jomu pētniekiem.

Vai esat kādreiz izmantojis Excel, lai aprēķinātu statistiskā modeļa p- vērtību? Kuru metodi izmantojāt? Vai jūs dodat priekšroku citam aprēķināšanas veidam? Paziņojiet mums komentāru sadaļā.

Kā aprēķināt p-vērtību Excel