Sample Size and Statistical Power Calculation in Genetic Association Studies

Eun Pyo Hong; Ji Wan Park

doi:10.5808/gi.2012.10.2.117

Design and Analysis of Genetic Association Studies to Finely Map a Locus Identified by Linkage Analysis: Sample Size and Power Calculations

Annals of Human Genetics ◽

10.1111/j.1529-8817.2005.00230.x ◽

2008 ◽

Vol 70 (3) ◽

pp. 332-349 ◽

Cited By ~ 13

Author(s):

R. L. Hanson ◽

H. C. Looker ◽

L. Ma ◽

Y. L. Muller ◽

L. J. Baier ◽

...

Keyword(s):

Linkage Analysis ◽

Sample Size ◽

Genetic Association ◽

Association Studies ◽

Genetic Association Studies ◽

Power Calculations

Download Full-text

Design of Large-Scale Genetic Association Studies, Sample Size, and Power

Design, Analysis, and Interpretation of Genome-Wide Association Scans - Statistics for Biology and Health ◽

10.1007/978-1-4614-9443-0_7 ◽

2013 ◽

pp. 243-284

Author(s):

Daniel O. Stram

Keyword(s):

Sample Size ◽

Genetic Association ◽

Large Scale ◽

Association Studies ◽

Genetic Association Studies

Download Full-text

An Analytic Solution to the Computation of Power and Sample Size for Genetic Association Studies under a Pleiotropic Mode of Inheritance

Human Heredity ◽

10.1159/000457135 ◽

2016 ◽

Vol 81 (4) ◽

pp. 194-209 ◽

Cited By ~ 1

Author(s):

Derek Gordon ◽

Douglas Londono ◽

Payal Patel ◽

Wonkuk Kim ◽

Stephen J. Finch ◽

...

Keyword(s):

Sample Size ◽

Genetic Association ◽

Analytic Solution ◽

Association Studies ◽

Genetic Association Studies ◽

Mode Of Inheritance

Download Full-text

GWAPower: a statistical power calculation software for genome-wide association studies with quantitative traits

BMC Genetics ◽

10.1186/1471-2156-12-12 ◽

2011 ◽

Vol 12 (1) ◽

pp. 12 ◽

Cited By ~ 41

Author(s):

Sheng Feng ◽

Shengchu Wang ◽

Chia-Cheng Chen ◽

Lan Lan

Keyword(s):

Statistical Power ◽

Quantitative Traits ◽

Association Studies ◽

Genome Wide Association ◽

Power Calculation ◽

Genome Wide Association Studies ◽

Genome Wide ◽

Statistical Power Calculation ◽

Calculation Software

Download Full-text

Power Estimation for Gene-Longevity Association Analysis Using Concordant Twins

Genetics Research International ◽

10.1155/2014/154204 ◽

2014 ◽

Vol 2014 ◽

pp. 1-8

Author(s):

Qihua Tan ◽

Jing Hua Zhao ◽

Torben Kruse ◽

Kaare Christensen

Keyword(s):

Association Study ◽

Genetic Association ◽

Association Analysis ◽

Statistical Power ◽

Association Studies ◽

Genetic Association Studies ◽

Small Sample ◽

Identical Twins ◽

Human Longevity ◽

Sample Sizes

Statistical power is one of the major concerns in genetic association studies. Related individuals such as twins are valuable samples for genetic studies because of their genetic relatedness. Phenotype similarity in twin pairs provides evidence of genetic control over the phenotype variation in a population. The genetic association study on human longevity, a complex trait that is under control of both genetic and environmental factors, has been confronted by the small sample sizes of longevity subjects which limit statistical power. Twin pairs concordant for longevity have increased probability for carrying beneficial genes and thus are useful samples for gene-longevity association analysis. We conducted a computer simulation to estimate the power of association study using longevity concordant twin pairs. We observed remarkable power increases in using singletons from longevity concordant twin pairs as cases in comparison with cases of sporadic proband. A similar power would require doubled sample sizes for fraternal twins than for identical twins who are concordant for longevity suggesting that longevity concordant identical twins are more efficient samples than fraternal twins. We also observed an approximate of 2- to 3-fold increase in sample sizes needed for longevity cutoff at age 90 as compared with that at age 95. Overall, our results showed high value of twins in genetic association studies on human longevity.

Download Full-text

Statistical power calculation and sample size determination for environmental studies with data below detection limits

Water Resources Research ◽

10.1029/2008wr007563 ◽

2009 ◽

Vol 45 (9) ◽

Cited By ~ 2

Author(s):

Quanxi Shao ◽

You-Gan Wang

Keyword(s):

Sample Size ◽

Statistical Power ◽

Detection Limits ◽

Environmental Studies ◽

Sample Size Determination ◽

Power Calculation ◽

Size Determination ◽

Statistical Power Calculation

Download Full-text

Improving statistical power in severe malaria genetic association studies by augmenting phenotypic precision

10.1101/2021.04.16.440107 ◽

2021 ◽

Author(s):

James A Watson ◽

Carolyne M Ndila ◽

Sophie Uyoga ◽

Alex W Macharia ◽

Gideon Nyutu ◽

...

Keyword(s):

Severe Malaria ◽

Genetic Association ◽

Statistical Power ◽

Association Studies ◽

Genetic Association Studies ◽

Diagnostic Model ◽

Genome Wide Association Studies ◽

Case Control Studies ◽

False Discovery Rates ◽

Population Controls

Severe falciparum malaria has substantially affected human evolution. Genetic association studies of patients with clinically defined severe malaria and matched population controls have helped characterise human genetic susceptibility to severe malaria, but phenotypic imprecision compromises discovered associations. In areas of high malaria transmission the diagnosis of severe malaria in young children and, in particular, the distinction from bacterial sepsis, is imprecise. We developed a probabilistic diagnostic model of severe malaria using platelet and white count data. Under this model we re-analysed clinical and genetic data from 2,220 Kenyan children with clinically defined severe malaria and 3,940 population controls, adjusting for phenotype mis-labelling. Our model, validated by the distribution of sickle trait, estimated that approximately one third of cases did not have severe malaria. We propose a data-tilting approach for case-control studies with phenotype mis-labelling and show that this reduces false discovery rates and improves statistical power in genome-wide association studies.

Download Full-text

Η επίδραση της βασιζόμενης σε ενδείξεις ιατρικής στην εξέλιξη της σημαντικότητας μεταξύ γενετικών πολυμορφισμών και νοσημάτων

10.12681/eadd/28940 ◽

2010 ◽

Author(s):

Θεοχάρης Κουφάκης

Keyword(s):

Sample Size ◽

Genetic Association ◽

Association Studies ◽

Meta Analysis ◽

Genetic Association Studies ◽

Forest Plot ◽

Z Score ◽

Median Test

Σκοπός: Να εξεταστεί η επίδραση των μετά-αναλύσεων μελετών γενετικής συσχέτισης (ΜΓΣ): Α) Στην εξέλιξη της σημαντικότητας μεταξύ γενετικών πολυμορφισμών και νοσημάτων.Β) Στη διαχρονική εξέλιξη ποιοτικών παραμέτρων των μελετών γενετικής συσχέτισης.Γ) Στη διαμόρφωση του μεγέθους δείγματος των μελετών γενετικής συσχέτισης.Δ) Στον ρυθμό δημοσίευσης των μελετών γενετικής συσχέτισης που εξετάζουν το ίδιο θέμα.Μέθοδοι: Μέσω συστηματικής αναζήτησης στη βάση δεδομένων HuGE Navigator εντοπίστηκαν όλες οι δημοσιευμένες τα έτη 2000 και 2001 μετά-αναλύσεις, οι οποίες κατεδείκνυαν σημαντική συσχέτιση ανάμεσα σε γενετικούς πολυμορφισμούς και νοσήματα. Το δείγμα των μετά-αναλύσεων συμπληρώθηκε από μετά-αναλύσεις δημοσιευμένες τα έτη 2005 και 2006 από το Εργαστήριο Βιομαθηματικών του Τμήματος Ιατρικής του Πανεπιστημίου Θεσσαλίας, οι οποίες κατεδείκνυαν σημαντικά αποτελέσματα για τη συνολική ανάλυση. Στη συνέχεια, αναζητούνταν μέσω εκτεταμένης ηλεκτρονικής αναζήτησης στην ηλεκτρονική, βιβλιογραφική βάση Pubmed, όλες οι μελέτες γενετικής συσχέτισης οι οποίες διερευνούσαν τη σχέση μεταξύ του πολυμορφισμού και του νοσήματος για τα οποία η σχετική μετά-ανάλυση είχε δώσει σημαντικά αποτελέσματα και οι οποίες είχαν δημοσιευθεί τουλάχιστον 12 μήνες μετά τον χρόνο δημοσίευσης της μετα-ανάλυσης. Όλες οι κατάλληλες μελέτες, στη συνέχεια, μετά-αναλύονταν προκειμένου να διαπιστωθεί η εξέλιξη της σημαντικότητας μεταξύ νοσήματος και πολυμορφισμού. Από το σύνολο των μελετών που θεωρούνταν ως κατάλληλες για να συμπεριληφθούν στη μετα-ανάλυση που θα ακολουθούσε (συχνά αναφερόμενη στο εξής ως 2η μετα-ανάλυση), υπολογίζονταν οι εξής παράμετροι προκειμένου να συγκριθούν με τις αντίστοιχες της πρώτης δημοσιευμένης στη HuGE Pub Lit σχετικής μετα-ανάλυσης (συχνά αναφερόμενη στο εξής ως 1η μετα-ανάλυση).•Ποσοστό των μελετών με συμμόρφωση της γονοτυπικής κατανομής στην ομάδα των μαρτύρων (controls group) στην ισορροπία Hardy–Weinberg.•ασθενείς/μάρτυρες/σύνολο•Διάμεσος (median) του αριθμού των υποκειμένων που συμπεριλαμβάνονταν στη μετα-ανάλυσηΤο x2 test χρησιμοποιήθηκε και για τη σύγκριση των ποσοστών συμμόρφωσης στο HWE πριν και μετά την 1η μετα-ανάλυση. (στάθμη σημαντικότητας p<0.05) Η σύγκριση των διαμέσων του αριθμού συμμετεχόντων των δύο μετά-αναλύσεων έγινε με το μη παραμετρικό Μοοd’s Median Test. (στάθμη σημαντικότητας p<0.05) Οι συγκεντρωτικοί λόγοι αναλογιών της 1ης και της 2ης μετα-ανάλυσης συγκρίνονταν μεταξύ τους με το z-score. Όλες οι κατάλληλες για μετά-ανάλυση μελέτες καταχωρήθηκαν στη βάση δεδομένων CUMAGAS -Cumulative Meta-Analysis of Genetic Association Studies (http://biomath.med.uth.gr). Η απεικόνιση της εξέλιξης της σημαντικότητας μεταξύ πολυμορφισμών και νοσημάτων έγινε σε διαγράμματα τύπου forest plot. Οι μέσες τιμές του αριθμού των μελετών γενετικής συσχέτισης που συμπεριλήφθηκαν στις 1ες και 2ες μετά-αναλύσεις συγκρίθηκαν μεταξύ τους με το μη παραμετρικό test Mann-Whitney U.Αποτελέσματα: Συνολικά εξετάστηκαν 52 μετά-αναλύσεις, από τις οποίες 28 αποκλείστηκαν από τη μελέτη για διάφορους λόγους. 24 μετά-αναλύσεις συμπεριλήφθησαν στη μελέτη, οι οποίες παρείχαν πληροφορίες για 23 νοσήματα, 21 γονίδια και 25 πολυμορφισμούς.Σε 17 από τις 31 περιπτώσεις (ποσοστό 54.83%), η στατιστικά σημαντική συσχέτιση που κατέδειξε η 1η μετά-ανάλυση επιβεβαιώνεται και από τη 2η. Σε 14 από τις 31 περιπτώσεις (ποσοστό 45.17%) αντίθετα, η 2η μετά-ανάλυση δεν επιβεβαιώνει τη 1η καταδεικνύοντας μη σημαντική συσχέτιση. Σε 11 από τις 31 (ποσοστό 35.48%) συγκρίσεις μεταξύ των O.R.s και 95% C.I. 1ων και 2ων μετά-αναλύσεων, ανιχνεύθηκαν στατιστικά σημαντικές διαφορές. Από αυτές, σε 9/31 περιπτώσεις (ποσοστό 29.03%), η σημαντικότητα της συσχέτισης πολυμορφισμού και νοσήματος που κατέδειξαν τα αποτελέσματα της 2ης μετά-ανάλυσης ήταν στατιστικά σημαντικά εξασθενημένη σε σχέση με τα αποτελέσματα της 1ης. Μόλις σε 2/31 συγκρίσεις (ποσοστό 6.45%), η σημαντικότητα της σχέσης πολυμορφισμού-νοσήματος στη 2η μετά-ανάλυση βρέθηκε στατιστικά σημαντικά ενισχυμένη σε σύγκριση με την 1η. Το μέγεθος δείγματος (sample size) των μελετών γενετικής συσχέτισης που συμπεριλήφθησαν στις 1ες και 2ες μετά-αναλύσεις, εμφάνισε στατιστικώς σημαντική διαφορά σε 4 από τις 28 συγκρίσεις (ποσοστό 14.28%). Από αυτές, σε 2/28 περιπτώσεις (ποσοστό 7.14%) το μέγεθος δείγματος στη 2η μετά-ανάλυση αυξήθηκε σημαντικά σε σχέση με τη 1η μετά-ανάλυση, ενώ στις υπόλοιπες 2/28 περιπτώσεις (ποσοστό 7.14%) μειώθηκε σημαντικά, συγκριτικά πάντα με τη 1η μετά-ανάλυση. Σε 1 από τις 20 συγκρίσεις (ποσοστό 5%) ανιχνεύθηκε στατιστικά σημαντική διαφορά, μεταξύ των ποσοστών συμμόρφωσης στην ισορροπία Η-W στην ομάδα των υγιών μαρτύρων των μελετών γενετικής συσχέτισης, που συμπεριλήφθησαν στις 1ες και 2ες μετά-αναλύσεις. Αν και η μέση τιμή του αριθμού των μελετών που συμπεριέλαβαν οι 2ες μετά-αναλύσεις είναι οριακά υψηλότερη (10,13 έναντι 9,62), όταν συγκριθεί με την αντίστοιχη μέση τιμή του αριθμού των μελετών που συμπεριέλαβαν οι 1ες μετά-αναλύσεις, η διαφορά είναι στατιστικώς μη σημαντική. (p=0.223, Mann-Whitney U test). Συμπεράσματα: Η μετά-ανάλυση αποτελεί ένα πολύτιμο εργαλείο σύνθεσης των αποτελεσμάτων των μελετών γενετικής συσχέτισης, που χαρακτηρίζεται από υψηλό βαθμό αξιοπιστίας και επαληθευσιμότητας των αποτελεσμάτων της. Η μετά-ανάλυση δε φαίνεται να επιδρά αξιόλογα στην ποιότητα, στο μέγεθος δείγματος και στο ρυθμό δημοσίευσης των ΜΓΣ που ακολουθούν.

Download Full-text

Power and Sample Size Calculations for Genetic Association Studies in the Presence of Genetic Model Misspecification

Human Heredity ◽

10.1159/000508558 ◽

2019 ◽

Vol 84 (6) ◽

pp. 256-271 ◽

Cited By ~ 1

Author(s):

Camille M. Moore ◽

Sean A. Jacobson ◽

Tasha E. Fingerlin

Keyword(s):

Sample Size ◽

Genetic Association ◽

Genetic Model ◽

Association Studies ◽

Model Misspecification ◽

Genetic Association Studies ◽

Genetic Effects ◽

Degree Of Freedom ◽

Environment Interaction ◽

Sample Size Calculations

Introduction: When analyzing data from large-scale genetic association studies, such as targeted or genome-wide resequencing studies, it is common to assume a single genetic model, such as dominant or additive, for all tests of association between a given genetic variant and the phenotype. However, for many variants, the chosen model will result in poor model fit and may lack statistical power due to model misspecification. Objective: We develop power and sample size calculations for tests of gene and gene × environment interaction, allowing for misspecification of the true mode of genetic susceptibility. Methods: The power calculations are based on a likelihood ratio test framework and are implemented in an open-source R package (“genpwr”). Results: We use these methods to develop an analysis plan for a resequencing study in idiopathic pulmonary fibrosis and show that using a 2-degree of freedom test can increase power to detect recessive genetic effects while maintaining power to detect dominant and additive effects. Conclusions: Understanding the impact of model misspecification can aid in study design and developing analysis plans that maximize power to detect a range of true underlying genetic effects. In particular, these calculations help identify when a multiple degree of freedom test or other robust test of association may be advantageous.

Download Full-text

Case recruitment in genetic association studies: larger sample size or greater homogeneity?

International Journal of Epidemiology ◽

10.1093/ije/dyi086 ◽

2005 ◽

Vol 34 (3) ◽

pp. 711-711 ◽

Cited By ~ 1

Author(s):

Chuen-Fei Chen ◽

Wen-Chung Lee

Keyword(s):

Sample Size ◽

Genetic Association ◽

Association Studies ◽

Genetic Association Studies ◽

Larger Sample

Download Full-text