scholarly journals Sample Size and Statistical Power Calculation in Genetic Association Studies

2012 ◽  
Vol 10 (2) ◽  
pp. 117 ◽  
Author(s):  
Eun Pyo Hong ◽  
Ji Wan Park
2016 ◽  
Vol 81 (4) ◽  
pp. 194-209 ◽  
Author(s):  
Derek Gordon ◽  
Douglas Londono ◽  
Payal Patel ◽  
Wonkuk Kim ◽  
Stephen J. Finch ◽  
...  

2014 ◽  
Vol 2014 ◽  
pp. 1-8
Author(s):  
Qihua Tan ◽  
Jing Hua Zhao ◽  
Torben Kruse ◽  
Kaare Christensen

Statistical power is one of the major concerns in genetic association studies. Related individuals such as twins are valuable samples for genetic studies because of their genetic relatedness. Phenotype similarity in twin pairs provides evidence of genetic control over the phenotype variation in a population. The genetic association study on human longevity, a complex trait that is under control of both genetic and environmental factors, has been confronted by the small sample sizes of longevity subjects which limit statistical power. Twin pairs concordant for longevity have increased probability for carrying beneficial genes and thus are useful samples for gene-longevity association analysis. We conducted a computer simulation to estimate the power of association study using longevity concordant twin pairs. We observed remarkable power increases in using singletons from longevity concordant twin pairs as cases in comparison with cases of sporadic proband. A similar power would require doubled sample sizes for fraternal twins than for identical twins who are concordant for longevity suggesting that longevity concordant identical twins are more efficient samples than fraternal twins. We also observed an approximate of 2- to 3-fold increase in sample sizes needed for longevity cutoff at age 90 as compared with that at age 95. Overall, our results showed high value of twins in genetic association studies on human longevity.


2021 ◽  
Author(s):  
James A Watson ◽  
Carolyne M Ndila ◽  
Sophie Uyoga ◽  
Alex W Macharia ◽  
Gideon Nyutu ◽  
...  

Severe falciparum malaria has substantially affected human evolution. Genetic association studies of patients with clinically defined severe malaria and matched population controls have helped characterise human genetic susceptibility to severe malaria, but phenotypic imprecision compromises discovered associations. In areas of high malaria transmission the diagnosis of severe malaria in young children and, in particular, the distinction from bacterial sepsis, is imprecise. We developed a probabilistic diagnostic model of severe malaria using platelet and white count data. Under this model we re-analysed clinical and genetic data from 2,220 Kenyan children with clinically defined severe malaria and 3,940 population controls, adjusting for phenotype mis-labelling. Our model, validated by the distribution of sickle trait, estimated that approximately one third of cases did not have severe malaria. We propose a data-tilting approach for case-control studies with phenotype mis-labelling and show that this reduces false discovery rates and improves statistical power in genome-wide association studies.


2010 ◽  
Author(s):  
Θεοχάρης Κουφάκης

Σκοπός: Να εξεταστεί η επίδραση των μετά-αναλύσεων μελετών γενετικής συσχέτισης (ΜΓΣ): Α) Στην εξέλιξη της σημαντικότητας μεταξύ γενετικών πολυμορφισμών και νοσημάτων.Β) Στη διαχρονική εξέλιξη ποιοτικών παραμέτρων των μελετών γενετικής συσχέτισης.Γ) Στη διαμόρφωση του μεγέθους δείγματος των μελετών γενετικής συσχέτισης.Δ) Στον ρυθμό δημοσίευσης των μελετών γενετικής συσχέτισης που εξετάζουν το ίδιο θέμα.Μέθοδοι: Μέσω συστηματικής αναζήτησης στη βάση δεδομένων HuGE Navigator εντοπίστηκαν όλες οι δημοσιευμένες τα έτη 2000 και 2001 μετά-αναλύσεις, οι οποίες κατεδείκνυαν σημαντική συσχέτιση ανάμεσα σε γενετικούς πολυμορφισμούς και νοσήματα. Το δείγμα των μετά-αναλύσεων συμπληρώθηκε από μετά-αναλύσεις δημοσιευμένες τα έτη 2005 και 2006 από το Εργαστήριο Βιομαθηματικών του Τμήματος Ιατρικής του Πανεπιστημίου Θεσσαλίας, οι οποίες κατεδείκνυαν σημαντικά αποτελέσματα για τη συνολική ανάλυση. Στη συνέχεια, αναζητούνταν μέσω εκτεταμένης ηλεκτρονικής αναζήτησης στην ηλεκτρονική, βιβλιογραφική βάση Pubmed, όλες οι μελέτες γενετικής συσχέτισης οι οποίες διερευνούσαν τη σχέση μεταξύ του πολυμορφισμού και του νοσήματος για τα οποία η σχετική μετά-ανάλυση είχε δώσει σημαντικά αποτελέσματα και οι οποίες είχαν δημοσιευθεί τουλάχιστον 12 μήνες μετά τον χρόνο δημοσίευσης της μετα-ανάλυσης. Όλες οι κατάλληλες μελέτες, στη συνέχεια, μετά-αναλύονταν προκειμένου να διαπιστωθεί η εξέλιξη της σημαντικότητας μεταξύ νοσήματος και πολυμορφισμού. Από το σύνολο των μελετών που θεωρούνταν ως κατάλληλες για να συμπεριληφθούν στη μετα-ανάλυση που θα ακολουθούσε (συχνά αναφερόμενη στο εξής ως 2η μετα-ανάλυση), υπολογίζονταν οι εξής παράμετροι προκειμένου να συγκριθούν με τις αντίστοιχες της πρώτης δημοσιευμένης στη HuGE Pub Lit σχετικής μετα-ανάλυσης (συχνά αναφερόμενη στο εξής ως 1η μετα-ανάλυση).•Ποσοστό των μελετών με συμμόρφωση της γονοτυπικής κατανομής στην ομάδα των μαρτύρων (controls group) στην ισορροπία Hardy–Weinberg.•ασθενείς/μάρτυρες/σύνολο•Διάμεσος (median) του αριθμού των υποκειμένων που συμπεριλαμβάνονταν στη μετα-ανάλυσηΤο x2 test χρησιμοποιήθηκε και για τη σύγκριση των ποσοστών συμμόρφωσης στο HWE πριν και μετά την 1η μετα-ανάλυση. (στάθμη σημαντικότητας p<0.05) Η σύγκριση των διαμέσων του αριθμού συμμετεχόντων των δύο μετά-αναλύσεων έγινε με το μη παραμετρικό Μοοd’s Median Test. (στάθμη σημαντικότητας p<0.05) Οι συγκεντρωτικοί λόγοι αναλογιών της 1ης και της 2ης μετα-ανάλυσης συγκρίνονταν μεταξύ τους με το z-score. Όλες οι κατάλληλες για μετά-ανάλυση μελέτες καταχωρήθηκαν στη βάση δεδομένων CUMAGAS -Cumulative Meta-Analysis of Genetic Association Studies (http://biomath.med.uth.gr). Η απεικόνιση της εξέλιξης της σημαντικότητας μεταξύ πολυμορφισμών και νοσημάτων έγινε σε διαγράμματα τύπου forest plot. Οι μέσες τιμές του αριθμού των μελετών γενετικής συσχέτισης που συμπεριλήφθηκαν στις 1ες και 2ες μετά-αναλύσεις συγκρίθηκαν μεταξύ τους με το μη παραμετρικό test Mann-Whitney U.Αποτελέσματα: Συνολικά εξετάστηκαν 52 μετά-αναλύσεις, από τις οποίες 28 αποκλείστηκαν από τη μελέτη για διάφορους λόγους. 24 μετά-αναλύσεις συμπεριλήφθησαν στη μελέτη, οι οποίες παρείχαν πληροφορίες για 23 νοσήματα, 21 γονίδια και 25 πολυμορφισμούς.Σε 17 από τις 31 περιπτώσεις (ποσοστό 54.83%), η στατιστικά σημαντική συσχέτιση που κατέδειξε η 1η μετά-ανάλυση επιβεβαιώνεται και από τη 2η. Σε 14 από τις 31 περιπτώσεις (ποσοστό 45.17%) αντίθετα, η 2η μετά-ανάλυση δεν επιβεβαιώνει τη 1η καταδεικνύοντας μη σημαντική συσχέτιση. Σε 11 από τις 31 (ποσοστό 35.48%) συγκρίσεις μεταξύ των O.R.s και 95% C.I. 1ων και 2ων μετά-αναλύσεων, ανιχνεύθηκαν στατιστικά σημαντικές διαφορές. Από αυτές, σε 9/31 περιπτώσεις (ποσοστό 29.03%), η σημαντικότητα της συσχέτισης πολυμορφισμού και νοσήματος που κατέδειξαν τα αποτελέσματα της 2ης μετά-ανάλυσης ήταν στατιστικά σημαντικά εξασθενημένη σε σχέση με τα αποτελέσματα της 1ης. Μόλις σε 2/31 συγκρίσεις (ποσοστό 6.45%), η σημαντικότητα της σχέσης πολυμορφισμού-νοσήματος στη 2η μετά-ανάλυση βρέθηκε στατιστικά σημαντικά ενισχυμένη σε σύγκριση με την 1η. Το μέγεθος δείγματος (sample size) των μελετών γενετικής συσχέτισης που συμπεριλήφθησαν στις 1ες και 2ες μετά-αναλύσεις, εμφάνισε στατιστικώς σημαντική διαφορά σε 4 από τις 28 συγκρίσεις (ποσοστό 14.28%). Από αυτές, σε 2/28 περιπτώσεις (ποσοστό 7.14%) το μέγεθος δείγματος στη 2η μετά-ανάλυση αυξήθηκε σημαντικά σε σχέση με τη 1η μετά-ανάλυση, ενώ στις υπόλοιπες 2/28 περιπτώσεις (ποσοστό 7.14%) μειώθηκε σημαντικά, συγκριτικά πάντα με τη 1η μετά-ανάλυση. Σε 1 από τις 20 συγκρίσεις (ποσοστό 5%) ανιχνεύθηκε στατιστικά σημαντική διαφορά, μεταξύ των ποσοστών συμμόρφωσης στην ισορροπία Η-W στην ομάδα των υγιών μαρτύρων των μελετών γενετικής συσχέτισης, που συμπεριλήφθησαν στις 1ες και 2ες μετά-αναλύσεις. Αν και η μέση τιμή του αριθμού των μελετών που συμπεριέλαβαν οι 2ες μετά-αναλύσεις είναι οριακά υψηλότερη (10,13 έναντι 9,62), όταν συγκριθεί με την αντίστοιχη μέση τιμή του αριθμού των μελετών που συμπεριέλαβαν οι 1ες μετά-αναλύσεις, η διαφορά είναι στατιστικώς μη σημαντική. (p=0.223, Mann-Whitney U test). Συμπεράσματα: Η μετά-ανάλυση αποτελεί ένα πολύτιμο εργαλείο σύνθεσης των αποτελεσμάτων των μελετών γενετικής συσχέτισης, που χαρακτηρίζεται από υψηλό βαθμό αξιοπιστίας και επαληθευσιμότητας των αποτελεσμάτων της. Η μετά-ανάλυση δε φαίνεται να επιδρά αξιόλογα στην ποιότητα, στο μέγεθος δείγματος και στο ρυθμό δημοσίευσης των ΜΓΣ που ακολουθούν.


2019 ◽  
Vol 84 (6) ◽  
pp. 256-271 ◽  
Author(s):  
Camille M. Moore ◽  
Sean A. Jacobson ◽  
Tasha E. Fingerlin

<b><i>Introduction:</i></b> When analyzing data from large-scale genetic association studies, such as targeted or genome-wide resequencing studies, it is common to assume a single genetic model, such as dominant or additive, for all tests of association between a given genetic variant and the phenotype. However, for many variants, the chosen model will result in poor model fit and may lack statistical power due to model misspecification. <b><i>Objective:</i></b> We develop power and sample size calculations for tests of gene and gene × environment interaction, allowing for misspecification of the true mode of genetic susceptibility. <b><i>Methods:</i></b> The power calculations are based on a likelihood ratio test framework and are implemented in an open-source R package (“genpwr”). <b><i>Results:</i></b> We use these methods to develop an analysis plan for a resequencing study in idiopathic pulmonary fibrosis and show that using a 2-degree of freedom test can increase power to detect recessive genetic effects while maintaining power to detect dominant and additive effects. <b><i>Conclusions:</i></b> Understanding the impact of model misspecification can aid in study design and developing analysis plans that maximize power to detect a range of true underlying genetic effects. In particular, these calculations help identify when a multiple degree of freedom test or other robust test of association may be advantageous.


Sign in / Sign up

Export Citation Format

Share Document