Using and expanding hybrid latent variable models for modelling missing data and for discovering influential points

2014 ◽  
Author(s):  
Ευγενία Τσομπανάκη

Ο όρος Υβριδικός χρησιμοποιείται γενικά για να περιγράψει το μεικτό χαρακτήρα ενός αντικειμένου το οποίο αποτελείται από δύο στοιχεία. Τα Υβριδικά μοντέλα λανθανουσών μεταβλητών επιτρέπουν τον ορισμό δύο ή περισσοτέρων κλάσεων και δομές εντός των ομάδων οι οποίες καλύπτουν ένα μεγάλο εύρος από απλή ανεξαρτησία (local independence) έως σύνθετες σχέσεις μεταξύ των λανθανουσών μεταβλητών. Στο Κεφάλαιο 1 γίνεται αναφορά και σχολιασμός της βιβλιογραφίας στο πεδίο των Υβριδικών μοντέλων καθώς και λεπτομερής παρουσίαση της διαδικασίας εκτίμησης με χρήση του ΕΜ ενός Υβριδικού Hybrid 2LC/2PL-Hom μοντέλου. Ο συμβολισμός 2LC/2PL-Hom δηλώνει ένα μοντέλο για το οποίο οι απαντήσεις στα ερωτήματα προς απόκριση εξαρτώνται από μία διακριτή λανθάνουσα μεταβλητή η οποία διαιρεί τον πληθυσμό σε δύο ομάδες (2LC) και επιπλέον ότι οι απαντήσεις στα ερωτήματα σε μία από τις δύο αυτές ομάδες εξαρτώνται από μία συνεχή λανθάνουσα μεταβλητή. Η πιθανότητα απάντησης για αυτή την ομάδα δίνεται από το μοντέλο δύο παραμέτρων (2PL-IRT). Η άλλη ομάδα θεωρείται ομογενής (Homogeneous-Hom) χωρίς κάποια άλλη λανθάνουσα δομή. Η προσαρμογή του μοντέλου αποτελεί το αντικείμενο συζήτησης και έρευνας των επόμενων δύο κεφαλαίων. Τεστ τα οποία εμπεριέχουν όλη την πληροφορία (Overall tests) και μέρος της πληροφορίας (Limited-information tests) των δεδομένων παρουσιάζονται και διερευνάται η συμπεριφορά τους μέσω προσομοίωσης για το 2LC/2PL-Hom μοντέλο σε ότι αφορά την ισχύ και το σφάλμα Τύπου Ι. Έμφαση δίνεται στην περίπτωση των δεδομένων τα οποία είναι αραιά (sparse) και τα οποία συναντάμε συχνά στο πεδίο εφαρμογής των λανθανουσών μοντέλων. Ως μέτρο για το πόσο αραιά είναι τα δεδομένα χρησιμοποιείται το ποσοστό των αναμενόμενων συχνοτήτων οι οποίες είναι μικρότερες ή ίσες με 5. Στο Κεφάλαιο 4 προτείνεται η χρήση του Hybrid 2LC/2PL-2PL μοντέλου για δίτιμα δεδομένα με ελλιπείς παρατηρήσεις οι οποίες δεν έχουν προέλθει τυχαία (MNAR) κατά τη διαδικασία απόκρισης των υποκειμένων. Το μοντέλο αυτό θεωρεί ότι τα ελλιπή (μη παρατηρούμενα) δεδομένα εξαρτώνται από κάτι επιπλέον σε σχέση με τα παρατηρούμενα και κάτω από τις απαραίτητες υποθέσεις και περιορισμούς επιτρέπει τα ελλιπή δεδομένα να συμπεριληφθούν στην ανάλυση. Συγκεκριμένα σύμφωνα με το προτεινόμενο μοντέλο η τάση των ερωτώμενων να αποκριθούν (response propensity) σχετίζεται με τις συγκεκριμένες ομάδες στις οποίες διαιρείται ο πληθυσμός από τη διακριτή λανθάνουσα μεταβλητή, η οποία μετράται από ένα σύνολο δίτιμων ερωτήσεων οι οποίες υποβάλλονται στα υποκείμενα. Στο Κεφάλαιο 5 γίνεται ανίχνευση σημείων επιρροής για δίτιμα δεδομένα με ένα 2PL-IRT μοντέλο με κύριο στόχο τον εντοπισμό τυχόν περιπτώσεων όπου τα αποτελέσματα της προσαρμογής ενός τέτοιου μοντέλου είναι παραπλανητικά και το προσδιορισμό της πηγής αυτού του φαινομένου.

2017 ◽  
Author(s):  
Conor Goold ◽  
Ruth C. Newberry

AbstractStudies of animal personality attempt to uncover underlying or ‘latent’ personality traits that explain broad patterns of behaviour, often by applying latent variable statistical models (e.g. factor analysis) to multivariate data sets. Two integral, but infrequently confirmed, assumptions of latent variable models in animal personality are: i) behavioural variables are independent (i.e. uncorrelated) conditional on the latent personality traits they reflect (local independence), and ii) personality traits are associated with behavioural variables in the same way across individuals or groups of individuals (measurement invariance). We tested these assumptions using observations of aggression in four age classes (4 - 10 months, 10 months - 3 years, 3 - 6 years, over 6 years) of male and female shelter dogs (N = 4,743) in 11 different contexts. A structural equation model supported the hypothesis of two positively correlated personality traits underlying aggression across contexts: aggressiveness towards people and aggressiveness towards dogs (comparative fit index: 0.96; Tucker-Lewis index: 0.95; root mean square error of approximation: 0.03). Aggression across contexts was moderately repeatable (towards people: intraclass correlation coefficient (ICC) = 0.479; towards dogs: ICC = 0.303).However, certain contexts related to aggressiveness towards people (but not dogs) shared significant residual relationships unaccounted for by latent levels of aggressiveness.Furthermore, aggressiveness towards people and dogs in different contexts interacted with sex and age. Thus, sex and age differences in displays of aggression were not simple functions of underlying aggressiveness. Our results illustrate that the robustness of traits in latent variable models must be critically assessed before making conclusions about the effects of, or factors influencing, animal personality. Our findings are of concern because inaccurate ‘aggressive personality’ trait attributions can be costly to dogs, recipients of aggression and society in general.


2020 ◽  
Author(s):  
Paul Silvia ◽  
Alexander P. Christensen ◽  
Katherine N. Cotter

Right-wing authoritarianism (RWA) has well-known links with humor appreciation, such as enjoying jokes that target deviant groups, but less is known about RWA and creative humor production—coming up with funny ideas oneself. A sample of 186 young adults completed a measure of RWA, the HEXACO-100, and 3 humor production tasks that involved writing funny cartoon captions, creating humorous definitions for quirky concepts, and completing joke stems with punchlines. The humor responses were scored by 8 raters and analyzed with many-facet Rasch models. Latent variable models found that RWA had a large, significant effect on humor production (β = -.47 [-.65, -.30], p < .001): responses created by people high in RWA were rated as much less funny. RWA’s negative effect on humor was smaller but still significant (β = -.25 [-.49, -.01], p = .044) after controlling for Openness to Experience (β = .39 [.20, .59], p < .001) and Conscientiousness (β = -.21 [-.41, -.02], p = .029). Taken together, the findings suggest that people high in RWA just aren’t very funny.


Appetite ◽  
2021 ◽  
pp. 105591
Author(s):  
Ching-Hua Yeh ◽  
Monika Hartmann ◽  
Matthew Gorton ◽  
Barbara Tocco ◽  
Virginie Amilien ◽  
...  

2021 ◽  
Vol 45 (3) ◽  
pp. 159-177
Author(s):  
Chen-Wei Liu

Missing not at random (MNAR) modeling for non-ignorable missing responses usually assumes that the latent variable distribution is a bivariate normal distribution. Such an assumption is rarely verified and often employed as a standard in practice. Recent studies for “complete” item responses (i.e., no missing data) have shown that ignoring the nonnormal distribution of a unidimensional latent variable, especially skewed or bimodal, can yield biased estimates and misleading conclusion. However, dealing with the bivariate nonnormal latent variable distribution with present MNAR data has not been looked into. This article proposes to extend unidimensional empirical histogram and Davidian curve methods to simultaneously deal with nonnormal latent variable distribution and MNAR data. A simulation study is carried out to demonstrate the consequence of ignoring bivariate nonnormal distribution on parameter estimates, followed by an empirical analysis of “don’t know” item responses. The results presented in this article show that examining the assumption of bivariate nonnormal latent variable distribution should be considered as a routine for MNAR data to minimize the impact of nonnormality on parameter estimates.


Sign in / Sign up

Export Citation Format

Share Document