Source code for queens.iterators.metropolis_hastings_pymc_iterator

#
# SPDX-License-Identifier: LGPL-3.0-or-later
# Copyright (c) 2024-2025, QUEENS contributors.
#
# This file is part of QUEENS.
#
# QUEENS is free software: you can redistribute it and/or modify it under the terms of the GNU
# Lesser General Public License as published by the Free Software Foundation, either version 3 of
# the License, or (at your option) any later version. QUEENS is distributed in the hope that it will
# be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
# FITNESS FOR A PARTICULAR PURPOSE. See the GNU Lesser General Public License for more details. You
# should have received a copy of the GNU Lesser General Public License along with QUEENS. If not,
# see <https://www.gnu.org/licenses/>.
#
"""Metropolis Hastings algorithm.

"The Metropolis Hastings algorithm is a not-gradient based MCMC
algortihm. It implements a random walk.
"""

import logging

import numpy as np
import pymc as pm

from queens.iterators.pymc_iterator import PyMCIterator
from queens.utils.logger_settings import log_init_args
from queens.utils.pymc import PymcDistributionWrapper

_logger = logging.getLogger(__name__)



[docs]
class MetropolisHastingsPyMCIterator(PyMCIterator):
    """Iterator based on MH-MCMC algorithm.

    The Metropolis Hastings sampler is a basic MCMC sampler.

    Attributes:
        covariance (np.array): Covariance for proposal distribution
        tune_interval: frequency of tuning
        scaling (float): Initial scale factor for proposal
    Returns:
        metropolis_hastings_iterator (obj): Instance of Metropolis-Hastings Iterator
    """

    @log_init_args
    def __init__(
        self,
        model,
        parameters,
        global_settings,
        num_samples,
        seed,
        num_burn_in=100,
        num_chains=1,
        discard_tuned_samples=True,
        result_description=None,
        summary=True,
        pymc_sampler_stats=False,
        as_inference_dict=False,
        use_queens_prior=False,
        progressbar=False,
        covariance=None,
        tune_interval=100,
        scaling=1.0,
    ):
        """Initialize Metropolis Hastings iterator.

        Args:
            model (Model): Model to be evaluated by iterator
            parameters (Parameters): Parameters object
            global_settings (GlobalSettings): settings of the QUEENS experiment including its name
                                              and the output directory
            num_samples (int): Number of samples to generate per chain, excluding burn-in period
            seed (int): Seed for rng
            num_burn_in (int, opt): Number of burn-in steps
            num_chains (int, opt): Number of chains to sample
            discard_tuned_samples (boolean, opt): Setting to discard the samples of the burin-in
                                                  period
            result_description (dict, opt): Settings for storing and visualizing the results
            summary (bool, opt):  Print sampler summary
            pymc_sampler_stats (bool, opt): Compute additional sampler statistics
            as_inference_dict (bool, opt): Return inference_data object instead of trace object
            use_queens_prior (boolean, opt): Setting for using the PyMC priors or the QUEENS prior
                                             functions
            progressbar (boolean, opt): Setting for printing progress bar while sampling
            covariance (np.array): Covariance for proposal distribution
            tune_interval: frequency of tuning
            scaling (float): Initial scale factor for proposal
        Returns:
            Initialise pymc iterator
        """
        if covariance is not None:
            covariance = np.array(covariance)

        super().__init__(
            model=model,
            parameters=parameters,
            global_settings=global_settings,
            num_burn_in=num_burn_in,
            num_chains=num_chains,
            num_samples=num_samples,
            discard_tuned_samples=discard_tuned_samples,
            result_description=result_description,
            summary=summary,
            pymc_sampler_stats=pymc_sampler_stats,
            as_inference_dict=as_inference_dict,
            seed=seed,
            use_queens_prior=use_queens_prior,
            progressbar=progressbar,
        )

        self.covariance = covariance
        self.tune_interval = tune_interval
        self.scaling = scaling

        if not use_queens_prior and len(self.parameters.to_list()) > 1:
            _logger.warning(
                "PyMC does element wise updates if multiple PymC priors are used, "
                "using QUEENS prior instead."
            )
            self.use_queens_prior = True


[docs]
    def eval_log_prior_grad(self, samples):
        """Evaluate the gradient of the log-prior."""
        raise NotImplementedError("No gradients are needed for Metropolis-Hastings")



[docs]
    def eval_log_likelihood(self, samples):
        """Evaluate the log-likelihood.

        Args:
             samples (np.array): Samples to evaluate the likelihood at

        Returns:
            log_likelihood (np.array): Log-likelihoods
        """
        # check if sample was buffered in previous acceptance step
        if self.buffered_samples is None:
            self.model_fwd_evals += self.num_chains
            self.buffered_samples = [samples.copy(), samples.copy(), samples.copy()]
            log_likelihood = self.model.evaluate(samples)
            self.buffered_likelihoods = [
                log_likelihood.copy(),
                log_likelihood.copy(),
                log_likelihood.copy(),
            ]
        else:
            if np.array_equal(self.buffered_samples[0], samples):
                log_likelihood = self.buffered_likelihoods[0]
            elif np.array_equal(self.buffered_samples[1], samples):
                log_likelihood = self.buffered_likelihoods[1]
            else:
                self.model_fwd_evals += self.num_chains
                log_likelihood = self.model.evaluate(samples)

        # update list of last samples and likelihoods
        self.buffered_samples.pop(0)
        self.buffered_samples.append(samples.copy())
        self.buffered_likelihoods.pop(0)
        self.buffered_likelihoods.append(log_likelihood.copy())

        return log_likelihood



[docs]
    def eval_log_likelihood_grad(self, samples):
        """Evaluate the gradient of the log-likelihood."""
        raise NotImplementedError("No gradients are used for Metropolis-Hastings")



[docs]
    def init_mcmc_method(self):
        """Init the PyMC MCMC Model.

        Returns:
            step (obj): The MCMC Method within the PyMC Model
        """
        dims = self.num_chains * self.parameters.num_parameters
        if self.covariance is None:
            covariance = np.eye(dims)
        elif self.covariance.shape == (dims, dims):
            covariance = self.covariance
        elif self.covariance.shape == (
            self.parameters.num_parameters,
            self.parameters.num_parameters,
        ):
            covariance = np.kron(np.eye(self.num_chains), self.covariance)
        else:
            raise ValueError("Covariance Matrix has not the right shape.")

        step = pm.Metropolis(
            S=covariance,
            scaling=self.scaling,
            tune_interval=self.tune_interval,
            model=self.pymc_model,
        )
        step.elemwise_update = False
        step.accept_rate_iter = np.zeros(self.num_chains, dtype=float)
        step.accepted_iter = np.zeros(self.num_chains, dtype=bool)
        step.accepted_sum = np.zeros(self.num_chains, dtype=int)

        return step



[docs]
    def post_run(self):
        """Additional post run for MH."""
        super().post_run()
        _logger.info(
            "Acceptance rate is: %f",
            self.step.accepted_sum / self.num_samples,
        )



[docs]
    def init_distribution_wrapper(self):
        """Init the PyMC wrapper for the QUEENS distributions."""
        self.log_like = PymcDistributionWrapper(self.eval_log_likelihood)
        if self.use_queens_prior:
            self.log_prior = PymcDistributionWrapper(self.eval_log_prior)
        _logger.info("Initialize Metropolis Hastings by PyMC run.")