ManimML/manim_ml/diffusion/mcmc.py

"""
    Tool for animating Markov Chain Monte Carlo simulations in 2D.
"""
from manim import *
import numpy as np
import scipy
import scipy.stats
from tqdm import tqdm

from manim_ml.probability import GaussianDistribution


def gaussian_proposal(x, sigma=0.2):
    """
    Gaussian proposal distribution.

    Draw new parameters from Gaussian distribution with
    mean at current position and standard deviation sigma.

    Since the mean is the current position and the standard
    deviation is fixed. This proposal is symmetric so the ratio
    of proposal densities is 1.

    Parameters
    ----------
    x : np.ndarray or list
        point to center proposal around
    sigma : float, optional
        standard deviation of gaussian for proposal, by default 0.1

    Returns
    -------
    np.ndarray
        propossed point
    """
    # Draw x_star
    x_star = x + np.random.randn(len(x)) * sigma
    # proposal ratio factor is 1 since jump is symmetric
    qxx = 1

    return (x_star, qxx)


class MultidimensionalGaussianPosterior:
    """
    N-Dimensional Gaussian distribution with

    mu ~ Normal(0, 10)
    var ~ LogNormal(0, 1.5)

    Prior on mean is U(-500, 500)
    """

    def __init__(self, ndim=2, seed=12345, scale=3, mu=None, var=None):
        """_summary_

        Parameters
        ----------
        ndim : int, optional
            _description_, by default 2
        seed : int, optional
            _description_, by default 12345
        scale : int, optional
            _description_, by default 10
        """
        np.random.seed(seed)
        self.scale = scale

        if var is None:
            self.var = 10 ** (np.random.randn(ndim) * 1.5)
        else:
            self.var = var

        if mu is None:
            self.mu = scipy.stats.norm(loc=0, scale=self.scale).rvs(ndim)
        else:
            self.mu = mu

    def __call__(self, x):
        """
        Call multivariate normal posterior.
        """

        if np.all(x < 500) and np.all(x > -500):
            return scipy.stats.multivariate_normal(mean=self.mu, cov=self.var).logpdf(x)
        else:
            return -1e6


def metropolis_hastings_sampler(
    log_prob_fn=MultidimensionalGaussianPosterior(),
    prop_fn=gaussian_proposal,
    initial_location: np.ndarray = np.array([0, 0]),
    iterations=25,
    warm_up=0,
    ndim=2,
):
    """Samples using a Metropolis-Hastings sampler.

    Parameters
    ----------
    log_prob_fn : function, optional
        Function to compute log-posterior, by default MultidimensionalGaussianPosterior
    prop_fn : function, optional
        Function to compute proposal location, by default gaussian_proposal
    initial_location : np.ndarray, optional
        initial location for the chain
    iterations : int, optional
        number of iterations of the markov chain, by default 100
    warm_up : int, optional,
        number of warm up iterations

    Returns
    -------
    samples : np.ndarray
        numpy array of 2D samples of length `iterations`
    warm_up_samples : np.ndarray
        numpy array of 2D warm up samples  of length `warm_up`
    candidate_samples: np.ndarray
        numpy array of the candidate samples for each time step
    """
    assert warm_up == 0, "Warmup not implemented yet"
    # initialize chain, acceptance rate and lnprob
    chain = np.zeros((iterations, ndim))
    proposals = np.zeros((iterations, ndim))
    lnprob = np.zeros(iterations)
    accept_rate = np.zeros(iterations)
    # first samples
    chain[0] = initial_location
    proposals[0] = initial_location
    lnprob0 = log_prob_fn(initial_location)
    lnprob[0] = lnprob0
    # start loop
    x0 = initial_location
    naccept = 0
    for ii in range(1, iterations):
        # propose
        x_star, factor = prop_fn(x0)
        # draw random uniform number
        u = np.random.uniform(0, 1)
        # compute hastings ratio
        lnprob_star = log_prob_fn(x_star)
        H = np.exp(lnprob_star - lnprob0) * factor
        # accept/reject step (update acceptance counter)
        if u < H:
            x0 = x_star
            lnprob0 = lnprob_star
            naccept += 1
        # update chain
        chain[ii] = x0
        proposals[ii] = x_star
        lnprob[ii] = lnprob0
        accept_rate[ii] = naccept / ii

    return chain, np.array([]), proposals


class MCMCAxes(Group):
    """Container object for visualizing MCMC on a 2D axis"""

    def __init__(
        self,
        dot_color=BLUE,
        dot_radius=0.05,
        accept_line_color=GREEN,
        reject_line_color=RED,
        line_color=WHITE,
        line_stroke_width=1,
    ):
        super().__init__()
        self.dot_color = dot_color
        self.dot_radius = dot_radius
        self.accept_line_color = accept_line_color
        self.reject_line_color = reject_line_color
        self.line_color = line_color
        self.line_stroke_width = line_stroke_width
        # Make the axes
        self.axes = Axes(
            x_range=[-3, 3],
            y_range=[-3, 3],
            x_length=12,
            y_length=12,
            x_axis_config={"stroke_opacity": 0.0},
            y_axis_config={"stroke_opacity": 0.0},
            tips=False,
        )
        self.add(self.axes)

    @override_animation(Create)
    def _create_override(self, **kwargs):
        """Overrides Create animation"""
        return AnimationGroup(Create(self.axes))

    def visualize_gaussian_proposal_about_point(self, mean, cov=None) -> AnimationGroup:
        """Creates a Gaussian distribution about a certain point

        Parameters
        ----------
        mean : np.ndarray
            mean of proposal distribution
        cov : np.ndarray
            covariance matrix of proposal distribution

        Returns
        -------
        AnimationGroup
            animation of creating the proposal Gaussian distribution
        """
        gaussian = GaussianDistribution(
            axes=self.axes, mean=mean, cov=cov, dist_theme="gaussian"
        )

        create_guassian = Create(gaussian)
        return create_guassian

    def make_transition_animation(
        self, start_point, end_point, candidate_point, run_time=0.1
    ) -> AnimationGroup:
        """Makes an transition animation for a single point on a Markov Chain

        Parameters
        ----------
        start_point: Dot
            Start point of the transition
        end_point : Dot
            End point of the transition

        Returns
        -------
        AnimationGroup
            Animation of the transition from start to end
        """
        start_location = self.axes.point_to_coords(start_point.get_center())
        end_location = self.axes.point_to_coords(end_point.get_center())
        candidate_location = self.axes.point_to_coords(candidate_point.get_center())
        # Figure out if a point is accepted or rejected
        # point_is_rejected = not candidate_location == end_location
        point_is_rejected = False
        if point_is_rejected:
            return AnimationGroup()
        else:
            create_end_point = Create(end_point)
            create_line = Create(
                Line(
                    start_point,
                    end_point,
                    color=self.line_color,
                    stroke_width=self.line_stroke_width,
                )
            )
            return AnimationGroup(
                create_end_point, create_line, lag_ratio=1.0, run_time=run_time
            )

    def show_ground_truth_gaussian(self, distribution):
        """ """
        mean = distribution.mu
        var = np.eye(2) * distribution.var
        distribution_drawing = GaussianDistribution(
            self.axes, mean, var, dist_theme="gaussian"
        ).set_opacity(0.2)
        return AnimationGroup(Create(distribution_drawing))

    def visualize_metropolis_hastings_chain_sampling(
        self,
        log_prob_fn=MultidimensionalGaussianPosterior(),
        prop_fn=gaussian_proposal,
        sampling_kwargs={},
    ):
        """
        Makes an animation for visualizing a 2D markov chain using
        metropolis hastings samplings

        Parameters
        ----------
        axes : manim.mobject.graphing.coordinate_systems.Axes
            Manim 2D axes to plot the chain on
        log_prob_fn : function, optional
            Function to compute log-posterior, by default MultidmensionalGaussianPosterior
        prop_fn : function, optional
            Function to compute proposal location, by default gaussian_proposal
        initial_location : list, optional
            initial location for the markov chain, by default None
        iterations : int, optional
            number of iterations of the markov chain, by default 100

        Returns
        -------
        animation : AnimationGroup
            animation for creating the markov chain
        """
        # Compute the chain samples using a Metropolis Hastings Sampler
        mcmc_samples, warm_up_samples, candidate_samples = metropolis_hastings_sampler(
            log_prob_fn=log_prob_fn, prop_fn=prop_fn, **sampling_kwargs
        )
        print(f"MCMC samples: {mcmc_samples}")
        print(f"Candidate samples: {candidate_samples}")
        # Make the animation for visualizing the chain
        animations = []
        # Place the initial point
        current_point = mcmc_samples[0]
        current_point = Dot(
            self.axes.coords_to_point(current_point[0], current_point[1]),
            color=self.dot_color,
            radius=self.dot_radius,
        )
        create_initial_point = Create(current_point)
        animations.append(create_initial_point)
        # Show the initial point's proposal distribution
        # NOTE: visualize the warm up and the iterations
        num_iterations = len(mcmc_samples) + len(warm_up_samples)
        for iteration in tqdm(range(1, num_iterations)):
            next_sample = mcmc_samples[iteration]
            print(f"Next sample: {next_sample}")
            candidate_sample = candidate_samples[iteration - 1]
            # Make the next point
            next_point = Dot(
                self.axes.coords_to_point(next_sample[0], next_sample[1]),
                color=self.dot_color,
                radius=self.dot_radius,
            )
            candidate_point = Dot(
                self.axes.coords_to_point(candidate_sample[0], candidate_sample[1]),
                color=self.dot_color,
                radius=self.dot_radius,
            )
            # Make a transition animation
            transition_animation = self.make_transition_animation(
                current_point, next_point, candidate_point
            )
            animations.append(transition_animation)
            # Setup for next iteration
            current_point = next_point
        # Make the final animation group
        animation_group = AnimationGroup(*animations, lag_ratio=1.0)

        return animation_group