Sequential Monte Carlo: Particle Filters and Beyond

Author(s):  
Adam M. Johansen
2018 ◽  
Author(s):  
Λυκούργος Κεκεμπάνος

Η εκπαίδευση σε βαθιά νευρωνικά δίκτυα (ΒΝΔ) είναι μια απαραίτητη διαδικασία στη μηχανική μάθηση. Η διαδικασία εκπαίδευσης των ΒΝΔ στοχεύει στη βελτιστοποίηση των τιμών των παραμέτρων του δικτύου, που συχνά βασίζεται στην παράγωγο των λογαριθμικών πιθανοτήτων των παραμέτρων. Ως εκ τούτου, είναι πολύ πιθανό η διαδικασία βελτιστοποίησης να βρει τοπικές βέλτιστες τιμές αντί για καθολικές. Επιπλέον, οι συμβατικές προσεγγίσεις που χρησιμοποιούνται για αυτή τη διαδικασία, όπως οι μέθοδοι Μαρκοβιανής αλυσίδας Μόντε Κάρλο, όχι μόνο προσφέρουν μη βέλτιστη απόδοση χρόνου εκτέλεσης, αλλά επίσης αποτρέπουν την αποτελεσματική παραλληλοποίηση λόγω εγγενών εξαρτήσεων στη διαδικασία. Σε αυτή τη διατριβή, εξετάζουμε μια εναλλακτική προσέγγιση στις μεθόδους Μαρκοβιανής αλυσίδας Μόντε Κάρλο (Markov Chain Monte Carlo, MCMC), τον δειγματολήπτη ακολουθιακών Μόντε Κάρλο (Sequential Monte Carlo, SMC), ο οποίος γενικεύει τα φίλτρα σωματιδίων (particle filters). Πιο συγκεκριμένα, η διατριβή εστιάζει στη βελτίωση της απόδοσης και της ακρίβειας των μεθόδων SMC, ιδιαίτερα στο πλαίσιο της πλήρους Μπεϋζιανής μάθησης. Σε αυτό το πλαίσιο, η διατριβή προτείνει μια νέα μέθοδο εκπαίδευσης νευρωνικών δικτύων χρησιμοποιώντας τις μεθόδους σημαντικής δειγματοληψίας (μέθοδος importance sampling) και επαναδειγματοληψίας. Η αρχική σύγκριση των δύο μεθόδων αποκαλύπτει ότι η προτεινόμενη μεθοδολογία είναι χειρότερη τόσο στην ακρίβεια όσο και στην απόδοση. Αυτό οδήγησε την έρευνα να επικεντρωθεί στην βελτίωση της απόδοσης και ακρίβειας της προτεινόμενης μεθοδολογίας. Η ανάλυση απόδοσης ξεκίνησε με την εφαρμογή μιας νέας προτεινόμενης, παράλληλης και πλήρως κατανεμημένης μεθοδολογίας επαναδειγματοληψίας, με βελτιωμένη χρονική πολυπλοκότητα από την αρχική προσέγγιση χρησιμοποιώντας δύο πλαίσια MapReduce, το Hadoop και το Spark. Τα αποτελέσματα δείχνουν ότι το Spark είναι έως και 25 φορές ταχύτερο από το Hadoop, ενώ στο Spark η νέα προτεινόμενη μεθοδολογία είναι έως και 10 φορές ταχύτερη από την αρχική μέθοδο. Ωστόσο, παρατηρείται ότι η εφαρμογή του ίδιου αλγορίθμου στο Message Passing Interface (MPI) παρέχει σημαντικά καλύτερους χρόνους εκτέλεσης και είναι πιο κατάλληλος για τον προτεινόμενο αλγόριθμο. Η ανάλυση ακρίβειας ξεκίνησε με πειράματα που δείχνουν ότι ο βασικός δειγματολήπτης SMC παρέχει χειρότερη ακρίβεια από τους εναλλακτικούς ή ανταγωνιστικούς αλγόριθμους MCMC. Τρεις διαφορετικές στρατηγικές εφαρμόζονται στον βασικό δειγματολήπτη SMC παρέχοντας καλύτερη ακρίβεια. Η ανάλυση επεκτείνεται για να συμπεριλάβει ανταγωνιστικούς αλγόριθμους. Η εξαντλητική αξιολόγηση δείχνει ότι η προτεινόμενη προσέγγιση προσφέρει ανώτερη απόδοση και ακρίβεια.


2011 ◽  
Vol 8 (2) ◽  
pp. 3383-3420 ◽  
Author(s):  
S. J. Noh ◽  
Y. Tachikawa ◽  
M. Shiiba ◽  
S. Kim

Abstract. Applications of data assimilation techniques have been widely used to improve hydrologic prediction. Among various data assimilation techniques, sequential Monte Carlo (SMC) methods, known as "particle filters", provide the capability to handle non-linear and non-Gaussian state-space models. In this paper, we propose an improved particle filtering approach to consider different response time of internal state variables in a hydrologic model. The proposed method adopts a lagged filtering approach to aggregate model response until uncertainty of each hydrologic process is propagated. The regularization with an additional move step based on Markov chain Monte Carlo (MCMC) is also implemented to preserve sample diversity under the lagged filtering approach. A distributed hydrologic model, WEP is implemented for the sequential data assimilation through the updating of state variables. Particle filtering is parallelized and implemented in the multi-core computing environment via open message passing interface (MPI). We compare performance results of particle filters in terms of model efficiency, predictive QQ plots and particle diversity. The improvement of model efficiency and the preservation of particle diversity are found in the lagged regularized particle filter.


2017 ◽  
Vol 49 (1) ◽  
pp. 24-48 ◽  
Author(s):  
Alexandros Beskos ◽  
Dan Crisan ◽  
Ajay Jasra ◽  
Kengo Kamatani ◽  
Yan Zhou

Abstract We consider the numerical approximation of the filtering problem in high dimensions, that is, when the hidden state lies in ℝd with large d. For low-dimensional problems, one of the most popular numerical procedures for consistent inference is the class of approximations termed particle filters or sequential Monte Carlo methods. However, in high dimensions, standard particle filters (e.g. the bootstrap particle filter) can have a cost that is exponential in d for the algorithm to be stable in an appropriate sense. We develop a new particle filter, called the space‒time particle filter, for a specific family of state-space models in discrete time. This new class of particle filters provides consistent Monte Carlo estimates for any fixed d, as do standard particle filters. Moreover, when there is a spatial mixing element in the dimension of the state vector, the space‒time particle filter will scale much better with d than the standard filter for a class of filtering problems. We illustrate this analytically for a model of a simple independent and identically distributed structure and a model of an L-Markovian structure (L≥ 1, L independent of d) in the d-dimensional space direction, when we show that the algorithm exhibits certain stability properties as d increases at a cost 𝒪(nNd2), where n is the time parameter and N is the number of Monte Carlo samples, which are fixed and independent of d. Our theoretical results are also supported by numerical simulations on practical models of complex structures. The results suggest that it is indeed possible to tackle some high-dimensional filtering problems using the space‒time particle filter that standard particle filters cannot handle.


Author(s):  
Edward P. Herbst ◽  
Frank Schorfheide

Dynamic stochastic general equilibrium (DSGE) models have become one of the workhorses of modern macroeconomics and are extensively used for academic research as well as forecasting and policy analysis at central banks. This book introduces readers to state-of-the-art computational techniques used in the Bayesian analysis of DSGE models. The book covers Markov chain Monte Carlo techniques for linearized DSGE models, novel sequential Monte Carlo methods that can be used for parameter inference, and the estimation of nonlinear DSGE models based on particle filter approximations of the likelihood function. The theoretical foundations of the algorithms are discussed in depth, and detailed empirical applications and numerical illustrations are provided. The book also gives invaluable advice on how to tailor these algorithms to specific applications and assess the accuracy and reliability of the computations. The book is essential reading for graduate students, academic researchers, and practitioners at policy institutions.


Sign in / Sign up

Export Citation Format

Share Document