import numpy as np
import matplotlib.pyplot as plt
from matplotlib import gridspec
from matplotlib import cm
import scipy.special as sp
# import scipy as sp
import pandas as pd
from operator import attrgetter
np.set_printoptions(precision=8)

import time
import pickle
import operator

from IPython.core.display import display, HTML
display(HTML("<style>.container { width:100% !important; }</style>"))
from IPython.display import Image

%matplotlib inline 

# https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet#links

def randgen(pr, N=1): 
    L = len(pr)
    return np.random.choice(range(L), size=N, replace=True, p=pr/np.sum(pr))

def log_sum_exp(l, axis=0):
    l_star = np.max(l, axis=axis, keepdims=True)
    return l_star + np.log(np.sum(np.exp(l - l_star),axis=axis,keepdims=True)) 

def safe_log_sum_exp(x, axis=0):
    return log_sum_exp(x,axis)

def normalize_exp(log_P, axis=0):
    a = np.max(log_P, keepdims=True, axis=axis)
    P = normalize(np.exp(log_P - a), axis=axis)
    return P

def normalize(A, axis=0):
    Z = np.sum(A, axis=axis, keepdims=True)
    idx = np.where(Z == 0)
    Z[idx] = 1
    return A/Z

def load_array(filename):
    X = np.loadtxt(filename)
    dim = int(X[0]);
    size = []
    for i in range(dim):
        size.append(int(X[i+1]));    
    X = np.reshape(X[dim+1:], size, order='F')
    return X;
        
def save_array(filename, X, format = '%.6f'):
    with open(filename, 'w') as f:
        dim = len(X.shape)
        f.write('%d\n' % dim)
        for i in range(dim):
            f.write('%d\n' % X.shape[i])
        temp = X.reshape(np.product(X.shape), order='F')
        for num in temp:
            f.write(str(num)+"\n")
        # np.savetxt(f, temp, fmt = format)
        
def plot_hist(data,xlines,title="",xlabel="",ylabel="",label_='changepoints'):
    (K,T) = data.shape
    fig = plt.figure(figsize=(30,4))
    ax = fig.gca()
    y,x = np.mgrid[slice(0, K+1, 1),slice(0,T+1,1)]
    im = ax.pcolormesh(x, y, data, cmap=cm.gray)
    fig.colorbar(im)
    ax.hold(True)
    plt1 = ax.vlines(np.arange(0,T), 0, xlines*K, colors='r', linestyles='-',label=label_,linewidth='3')
    ax.set_title(title)
    ax.set_xlabel(xlabel)
    ax.set_ylabel(ylabel)
    ax.legend(handles=[plt1])
    fig.canvas.draw()

def plot_matrix(X, title='Title', xlabel='xlabel', ylabel='ylabel', figsize=None):
    if figsize is None:
        plt.figure(figsize=(25,6))
    else:
        plt.figure(figsize=figsize)
    plt.imshow(X, interpolation='none', vmax=np.max(X), vmin=0, aspect='auto')
    plt.colorbar()
    plt.set_cmap('gray_r')
    plt.xlabel(xlabel)
    plt.ylabel(ylabel)
    plt.title(title)

Image(filename='etc/graphical_model.png', width=600, height=200)

T = 80   # time index
K = 10   # input dimension
c = 0.05   # prior on change point probability 
# a = np.ones(K)/K    # hyperparameter of reset parameter
a = np.ones(K)    # hyperparameter of reset parameter

cps = np.random.binomial(1,c,size=T)
actual_changepoints = np.where(cps==1)[0]
pi_0 = np.random.dirichlet(a)
pi_ = np.zeros((K,T))
data = np.zeros((K,T))

for t in range(T):
    if cps[t]:
        pi_[:,t] = np.random.dirichlet(a)
    elif t==0:
        pi_[:,t] = pi_0
    else:
        pi_[:,t] = pi_[:,t-1]
    data[:,t] = np.random.multinomial(np.random.randint(10,50),pi_[:,t])

def plot_hist(data,xlines,title="",xlabel="",ylabel="",label_='changepoints'):
    (K,T) = data.shape
    fig = plt.figure(figsize=(18,4))
    ax = fig.gca()
    y,x = np.mgrid[slice(0, K+1, 1),slice(0,T+1, 1)]
    ax.pcolormesh(x, y, data)
    ax.hold(True)
    plt1 = ax.vlines(np.arange(0,T), 0, xlines*K, colors='r', linestyles='-',label=label_,linewidth='3')
    ax.set_title(title)
    ax.set_xlabel(xlabel)
    ax.set_ylabel(ylabel)
    ax.legend(handles=[plt1])
    fig.canvas.draw()
    
plot_hist(data,cps,title="Data generated using the above generative model", xlabel="Time",ylabel="Data Vectors")

class MixtureComponent:
    def __init__(self,alpha_,c_):
        self.alpha = alpha_
        self.c = c_
    def copy(self):
        return MixtureComponent(self.alpha.copy(), self.c)

def dir_dir_norm_const(alpha1,alpha2):
    return  sp.gammaln(np.sum(alpha1)) - np.sum(sp.gammaln(alpha1)) + \
            sp.gammaln(np.sum(alpha2)) - np.sum(sp.gammaln(alpha2)) + \
            np.sum(sp.gammaln(alpha1+alpha2-1)) - sp.gammaln(np.sum(alpha1+alpha2-1))

def dir_mult_norm_const(alpha1,alpha2):
    return  sp.gammaln(np.sum(alpha1)+1) - np.sum(sp.gammaln(alpha1+1)) + \
            sp.gammaln(np.sum(alpha2))- np.sum(sp.gammaln(alpha2)) +\
            np.sum(sp.gammaln(alpha1+alpha2)) - sp.gammaln(np.sum(alpha1+alpha2))

def multiply(comp1, comp2):
    norm_const = comp1.c + comp2.c + dir_dir_norm_const(comp1.alpha, comp2.alpha)
    alpha = comp1.alpha + comp2.alpha - 1
    return MixtureComponent(alpha, norm_const)

K = 5
a = MixtureComponent(np.ones(K),-sp.gammaln(K))
b = MixtureComponent(np.random.random(K),-71.2)
print(b.alpha)
print(b.c)

m = multiply(a,b)
print(m.alpha)
print(m.c)

[ 0.68853789  0.74759069  0.59645085  0.88967388  0.78955634]
-71.2
[ 0.68853789  0.74759069  0.59645085  0.88967388  0.78955634]
-71.2

class Message:
    def __init__(self):
        self.components = []

    def copy(self):
        new_msg = Message()
        new_components = []
        for v in self.components:
            new_components.append(v.copy())
        new_msg.components = new_components
        return new_msg

    def eval_mean_and_cpp(self):
        params = []
        consts = []
        for prt in self.components:
            consts.append(prt.c)
            params.append(prt.alpha/np.sum(prt.alpha))
        params = np.array(params).T
        consts = np.array(consts)
        # re-weight components for normalization
        tmp = np.exp(consts - np.max(consts))
        norm_consts = tmp/tmp.sum()
        mean = (params*norm_consts).sum(1)#*np.exp(max_const)
        return mean, norm_consts[-1], consts

    def log_lhood(self):
        consts = []
        for prt in self.components:
            consts.append(prt.c)
        consts = np.array(consts)
        return safe_log_sum_exp(consts)

class DirichletCPModel:
    def __init__(self, _c, _a):
        self.a = _a             # default Dir hyperparam
        self.K = len(_a)        # input dimension
        self.c = _c             # prob. of change
        self.log_p1 = np.log(self.c)            # log prob. of change
        self.log_p0 = np.log(1-self.c)          # log prob. no change

    def init_forward_msg(self):
        no_change_component = MixtureComponent(self.a, self.log_p0)  
        change_component = MixtureComponent(self.a, self.log_p1)  
        msg = Message()
        msg.components.append(no_change_component)
        msg.components.append(change_component)
        return msg
        
    def init_backward_msg(self):
        component = MixtureComponent(np.ones(self.K), -sp.gammaln(self.K))   # initial component
        msg = Message()
        msg.components.append(component)
        msg.mean = np.zeros(self.K)
        return msg

    def multiply(self, a_upd, b_post):
        no_change_norm_consts = np.array([])
        change_norm_consts = np.array([])
        smt_msg = Message()
        for comp_a in a_upd.components[:-1]:
            for comp_b in b_post.components:
                new_comp = multiply(comp_a, comp_b)
                # new_comp.c += self.log_p0 #########################################333
                no_change_norm_consts = np.hstack((no_change_norm_consts, new_comp.c))
                smt_msg.components.append(new_comp)

        for comp_b in b_post.components:
            new_comp = multiply(a_upd.components[-1], comp_b)
            # new_comp.c += self.log_p1 #########################################333
            change_norm_consts = np.hstack((change_norm_consts, new_comp.c))
            smt_msg.components.append(new_comp)
    
        [mean,_,_] = smt_msg.eval_mean_and_cpp()
                    
        log_p_no_change = safe_log_sum_exp(no_change_norm_consts)
        log_p_change = safe_log_sum_exp(change_norm_consts)
        mx = np.maximum(log_p_no_change,log_p_change)
        cpp = np.exp( log_p_change - (mx + np.log(np.exp(log_p_change-mx)+np.exp(log_p_no_change-mx)) ) )
        return mean, cpp, smt_msg
        # above line returns np.exp(log_p_change) / ( np.exp(log_p_no_change) + np.exp(log_p_change) )

    def predict(self,msg):
        consts = []
        for prt in msg.components:
            consts.append(prt.c)
        consts = np.array(consts)
        max_const =  np.max(consts)
        running_sum = 0     # norm. const of the new message
        for comp in msg.components:
            running_sum += np.exp(comp.c - max_const)
            comp.c += self.log_p0
        new_prt = MixtureComponent(self.a, self.log_p1 + max_const + np.log(running_sum))
        msg.components.append(new_prt)
    
    def postdict(self,msg):
        consts = []
        reset = MixtureComponent(self.a, -sp.gammaln(self.K)) # placeholder for postdict. 
        for comp in msg.components:
            tmp = multiply(reset, comp)
            consts.append(tmp.c)
            comp.c += self.log_p0
        new_comp = MixtureComponent(np.ones(self.K), self.log_p1+safe_log_sum_exp(np.array(consts)))
        msg.components.append(new_comp)

    def update(self, msg, data):
        for prt in msg.components:
            change = dir_mult_norm_const(data,prt.alpha)
            prt.alpha += data
            prt.c += change

    def print_vars(self,message):
        for prt in message.components:
            print("constant={:f}, vector:{}".format(prt.c,prt.alpha))

    @staticmethod
    def gen_sequence(c, a, T=100):
        # T (duration)
        # K (dimensionality)
        # c (prior of change point prob.)
        # a (reset parameter)
        K = len(a)

        cps = np.random.binomial(1,c,size=T)
        actual_changepoints = np.where(cps==1)[0]
        pi_0 = np.random.dirichlet(a)
        pi_ = np.zeros((K,T))
        data = np.zeros((K,T))

        for t in range(T):
            if cps[t]:
                pi_[:,t] = np.random.dirichlet(a)
            elif t==0:
                pi_[:,t] = pi_0
            else:
                pi_[:,t] = pi_[:,t-1]
            data[:,t] = np.random.multinomial(np.random.randint(10,50),pi_[:,t])
        
        return [cps, pi_, data]

class ForwardBackward:
    def __init__(self, model, L=0, max_components=100):
        self.K = len(model.a)                   # dimension of the data
        self.model = model                      # change point model instance
        self.L = L                              # lag of fixed lag of smoothing
        self.max_components = max_components    # upper limit on the number of components stored
        
    def forward(self,data):
        T = data.shape[1];                 # number of observations
        alpha_predict = []                 # alpha_{t|t-1} messages
        alpha_update = []                  # alpha_{t|t} messages
        p_change = np.zeros(T)             # zero-indexing
        mean = np.zeros((self.K,T))        # zero-indexing
        for t in range(T):
            # predict
            if t==0:
                init_msg = self.model.init_forward_msg()
                alpha_predict.append(init_msg)
            else:
                alpha_predict.append(alpha_update[-1].copy())
                self.predict(alpha_predict[-1])
            # update
            alpha_update.append(alpha_predict[-1].copy())
            self.update(alpha_update[-1],data[:,t])
            # posterior calculation
            [mean_vec, cpp, _] = alpha_update[-1].eval_mean_and_cpp()
            p_change[t] = cpp
            mean[:,t] = mean_vec
            # fixed_lag_smoothing
            if self.L > 0 and t > self.L: 
                self.fixed_lag_smoothing(t,p_change,mean)
            # pruning
            self.prun(alpha_update[-1])
        return [alpha_predict, alpha_update, p_change, mean]
    
    def backward(self,data):
        T = data.shape[1];                 # number of observations
        beta_postdict = []                 # beta_{t|t+1} messages
        beta_update = []                   # beta_{t|t} messages
        p_change = np.zeros(T+1)             # zero-indexing
        mean = np.zeros((self.K,T))          # zero-indexing
        for t in range(T-1,-1,-1):
            # postdict
            if t==T-1:
                init_msg = self.model.init_backward_msg()
                beta_postdict.append(init_msg)
            else:
                beta_postdict.append(beta_update[-1].copy())
                self.postdict(beta_postdict[-1])
            # update
            beta_update.append(beta_postdict[-1].copy())
            self.update(beta_update[-1],data[:,t])
            # posterior calculation
            [mean_vec, cpp, _] = beta_update[-1].eval_mean_and_cpp()
            p_change[t+1] = cpp
            mean[:,t] = mean_vec
            # pruning
            self.prun(beta_update[-1])
        return [beta_postdict, beta_update, p_change, mean]
    
    def smoothing(self,data):
        [alpha_predict, alpha_update, _, _] = self.forward(data)
        [beta_postdict, beta_update, _, _] = self.backward(data)
        T = data.shape[1];        
        mean = np.zeros((self.K,T))
        p_change = np.zeros(T)     
        smt_msgs = []
        
        for t in range(0,T,1):
            mean_vec, cpp, smt_msg = self.model.multiply(alpha_update[t],beta_postdict[T-1-t])
            mean[:,t] = mean_vec
            p_change[t] = cpp
            smt_msgs.append(smt_msg)
        
        return [mean, p_change, smt_msgs]
    
    @staticmethod
    def loglhood(c, a, data, L=0):
        model = DirichletCPModel(c,a)
        fb = ForwardBackward(model, L=0, max_components=1000)
        [_, alpha_update, _, _] = fb.forward(data)
        norm_consts = [cmp.c for cmp in alpha_update[-1].components]
        return safe_log_sum_exp(norm_consts)
    
    def predict(self,msg):
        self.model.predict(msg)
        
    def postdict(self,msg):
        self.model.postdict(msg)

    def update(self, msg, data):
        self.model.update(msg,data)
    
    def prun(self,msg):
        if len(msg.components) > self.max_components:
            no_ch_components = msg.components[:-1]
            min_part = min(no_ch_components,key=attrgetter('c'))
            msg.components.remove(min_part)

T = 50
K = 10
[cps, pi_, data] = DirichletCPModel.gen_sequence(0.05, np.ones(K), T=T)
save_array("/tmp/data.txt",data)

model = DirichletCPModel(0.1 ,np.ones(K))
fb = ForwardBackward(model,L=0)

[alpha_predict, alpha_update, p_change_f, mean_f] = fb.forward(data)
tmp = []
for comp in alpha_update[10].components:
    tmp.append(comp.c)
print(safe_log_sum_exp(np.array(tmp)))

[beta_postdict, beta_update, p_change_b, mean_b] = fb.backward(data)

model_output_forward = [i for i in range(T) if p_change_f[i]>0.5]
model_output_backward = [i for i in range(T) if p_change_b[i]>0.5]

print("actual_changepoints:\t {}".format(np.where(cps==1)[0]))
print("model_output_forward:\t {}".format(model_output_forward))
print("model_output_backward:\t {}".format(model_output_backward))

plot_hist(data,cps,title="Data generated using the above generative model", xlabel="Time",ylabel="Data Vectors")
plot_hist(pi_,cps,title="Params of Multinomial Distribution (pi_t)", xlabel="Time",ylabel="Parameter Vectors")

plot_hist(mean_f,p_change_f,title="Filtered Density on Forward Direction", xlabel="Time",ylabel="Density")
plot_hist(mean_b,p_change_b,title="Filtered Density on Backward Direction", xlabel="Time",ylabel="Density")

[mean, p_change, smt_msgs] = fb.smoothing(data)
print(mean[0,:])
plot_hist(mean,p_change,title="Smoothed Density on Full Observation", xlabel="Time",ylabel="Density")

[-153.00450549]
actual_changepoints:	 []
model_output_forward:	 []
model_output_backward:	 []
[ 0.1183844   0.11838368  0.11838368  0.11838366  0.11838366  0.11838366
  0.11838366  0.11838366  0.11838366  0.11838366  0.11838365  0.11838365
  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365
  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365
  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365
  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365
  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365  0.11838365
  0.11838365  0.11838365  0.11838365  0.11838366  0.11838366  0.11838367
  0.1183838   0.11836577]

''' 
computes the expectation of log of each element of a Dirichlet random variable
with respect to a mixture of Dirichlet potentials
    - msg is a message, made up of components
'''
def compute_ss(msg):
    K = len(msg.components[0].alpha)
    M = len(msg.components)
    tmp = np.zeros((K, M)) # K-by-M matrix
    log_norm_consts = np.zeros(M) # log constants, as many as components
    for i in range(M):
        comp = msg.components[i]
        log_norm_consts[i] = comp.c
        tmp[:,i] = sp.digamma(comp.alpha) - sp.digamma(comp.alpha.sum())
    # numerically stable computation
    log_max_norm_const = np.max(log_norm_consts)
    norm_consts = np.exp(log_norm_consts-log_max_norm_const)
    return (tmp*norm_consts).sum(1) / np.sum(norm_consts)

# given y, returns x, where y = \psi(x)
def inv_digamma(y, eps_=1e-3):
    # here is the good initial start
    x = (y>-2.22)*(np.exp(y)+0.5) + (y<=-2.22)*(-1/(y-sp.digamma(1)))
    # iterate until convergence
    while np.sum( np.abs(sp.digamma(x)-y) > eps_ ) > 0:
        x = x - (sp.digamma(x)-y)/sp.polygamma(1,x)
    # check for a numerical issue 
    if pd.isnull(x).any():
        raise ValueError("inv_digamma() output contains a nan value for the input:", y)
    return x

a = np.array([0.1,1,2,3,4])
inv_a = inv_digamma(a)
print(sp.digamma(inv_a))

x = np.arange(-1e2,10,1e-1)
plt.plot(x,inv_digamma(x))
plt.title("inv_digamma")

plt.figure()
y = np.arange(1e-6,1e-4,1e-6)
plt.plot(y,sp.digamma(y))
plt.title("digamma")

plt.figure()
z = np.arange(0,1.5,1e-4)
plt.plot(z,sp.polygamma(1,z))
plt.title("polygamma")

[ 0.09954798  0.9999849   1.99999971  2.99999999  4.        ]

<matplotlib.text.Text at 0x7f8e01c592b0>

###################################### DATA GENERATION ######################################
T = 50
K = 10
c_true = 0.08
a_true = np.ones(K)*1
[cps, pi_, data] = DirichletCPModel.gen_sequence(c_true, a_true, T=T)
data += 1
save_array("/tmp/data.txt",data)
print(np.sum(cps), "change points")
print("a:", a_true)
plot_hist(data,cps,title="Data generated using the above generative model", xlabel="Time",ylabel="Data Vectors")

    
###################################### EM ALGORITHM ######################################

# constants
INV_DIG_ITER = 1000
MAX_ITER = 15
EM_EPS = 1e-5
c = 0.2
a = np.random.random(K)*20
save_array("/tmp/alpha.txt", a)

fb = ForwardBackward(DirichletCPModel(c, a))

loglhoods = []
means = []
cpps = []

for i in range(MAX_ITER):
    ############ log-likelihood calculation ###########
    ll = ForwardBackward.loglhood(c, a, data)
    loglhoods.append(ll)
    print("\nloglhood is", loglhoods[i])
    # print("current a is", a)
    
    ################ check convergence ################
    if i>0:
        if loglhoods[i]-loglhoods[i-1]<0:
            print("Likelihood decreased by " + str(loglhoods[i]-loglhoods[i-1]))
        elif loglhoods[i]-loglhoods[i-1]<EM_EPS:
            print("Converged")
            break
    
    ############ E step and sufficient stats ############
    [mean, cpp, smt_msgs] = fb.smoothing(data)
    means.append(mean)
    cpps.append(cpp)
    # plot_hist(mean,cpp,title="Smoothed Density on Full Observation at time " + str(i), xlabel="Time",ylabel="Density")
    
    E_log_pi = np.zeros((K,T))
    for j in range(T):
        E_log_pi[:,j] = compute_ss(smt_msgs[j]) 
    E_log_pi_weighted = (E_log_pi*cpp)
    ss = E_log_pi_weighted.sum(1) / np.sum(cpp)
    print(ss)
    
    ###################### M step ######################     
    c = np.sum(cpp)/len(cpp)
    for it in range(INV_DIG_ITER):
        a = inv_digamma( ss + sp.digamma(a.sum()) )
    
    fb = ForwardBackward(DirichletCPModel(c, a))
    
# results    
print("a_true:", a_true)
print("c_true:", c_true)
print("a_est :",a)
print("c_est :",c)

plt.figure()
plt.plot(loglhoods)
plt.ylabel("Log-likelihood")
plt.xlabel("EM iteration #")
plt.show()
plot_hist(means[-1],cpps[-1],title="Smoothed Density on Full Observation at time " + str(i), xlabel="Time",ylabel="Density")

6 change points
a: [ 1.  1.  1.  1.  1.  1.  1.  1.  1.  1.]

loglhood is [-939.07038346]
[-2.47287431 -2.22034842 -2.78350253 -2.43092495 -2.23998384 -2.75133308
 -2.28655976 -2.23407869 -2.30429278 -1.95167939]

loglhood is [-846.67370545]
[-2.50367676 -2.34336322 -2.92768113 -2.2679198  -2.31628241 -2.50298268
 -2.20852926 -2.1526982  -2.34811096 -1.95487376]

loglhood is [-877.21242905]
Likelihood decreased by [-30.5387236]
[-2.4832466  -2.36835061 -2.96090852 -2.2308746  -2.32765483 -2.44589215
 -2.19168089 -2.15202555 -2.37651918 -1.95290847]

loglhood is [-892.19764995]
Likelihood decreased by [-14.9852209]
[-2.46825501 -2.37638791 -2.9724551  -2.21662539 -2.32710888 -2.42291411
 -2.18833482 -2.15385733 -2.39210794 -1.95233123]

loglhood is [-899.37786465]
Likelihood decreased by [-7.1802147]
[-2.46072859 -2.37975257 -2.97679425 -2.2099541  -2.32526306 -2.4137207
 -2.18645661 -2.15570309 -2.39966461 -1.95108414]

loglhood is [-903.14247164]
Likelihood decreased by [-3.76460699]

---------------------------------------------------------------------------
KeyboardInterrupt                         Traceback (most recent call last)
<ipython-input-19-66a710f06bed> in <module>()
     65     E_log_pi = np.zeros((K,T))
     66     for j in range(T):
---> 67         E_log_pi[:,j] = compute_ss(smt_msgs[j])
     68     E_log_pi_weighted = (E_log_pi*cpp)
     69     ss = E_log_pi_weighted.sum(1) / np.sum(cpp)

<ipython-input-15-e7be04997f75> in compute_ss(msg)
     12         comp = msg.components[i]
     13         log_norm_consts[i] = comp.c
---> 14         tmp[:,i] = sp.digamma(comp.alpha) - sp.digamma(comp.alpha.sum())
     15     # numerically stable computation
     16     log_max_norm_const = np.max(log_norm_consts)

KeyboardInterrupt:

# method-2: https://www.hiit.fi/u/ahonkela/dippa/node95.html
K = 5
alpha = np.random.random(K)
N = 100000

# exact sufficient statistics
E_log_pi_exact = sp.digamma(alpha) - sp.digamma(alpha.sum())

# monte carlo
samples = np.random.dirichlet(alpha,N)
logsamples = np.log(samples)
E_log_pi_emp = logsamples.sum(0)/N

print("E_log_pi_exact:", E_log_pi_exact)
print("E_log_pi_empir:", E_log_pi_emp)

a = np.random.random(K)*25
a_old = np.zeros(K)
while np.sum( np.abs( a-alpha ) ) > 1e-3 and np.sum(np.abs(a-a_old))>1e-10:
    a_old = a.copy()
    a = inv_digamma( E_log_pi_emp + sp.digamma(a.sum()) )

print("alpha:     ", alpha)
print("estimation:", a)

E_log_pi_exact: [-1.63156869 -4.89641487 -8.48324734 -1.7261939  -1.93025423]
E_log_pi_empir: [-1.62652558 -4.87088593 -8.51355972 -1.72979668 -1.92054335]
alpha:      [ 0.91697848  0.26471757  0.13879428  0.86838363  0.77603482]
estimation: [ 0.92298556  0.2667529   0.13834213  0.86962401  0.78261646]

A TUTORIAL ON CHANGEPOINT MODELS¶

Graphical Model¶

Inference in CPM's¶

Filtering (Forward Recursion)¶

Backward Recursion¶

Smoothing¶

Example: Dirichlet-Multinomial CPM¶

Generative Model¶

Implementational Details¶

Dirichlet Potential¶

Multiplication of Dirichlet Potentials¶

Multinomial Density as a Dirichlet Potential¶

Calculation of $p(r_t)$ and $p(\pi_t)$ from a Mixture of Dirichlet Potentials¶

Forward-Backward Recursions¶

Implementation of the Model¶

Implementation of Forward Backward Algorithm¶

Parameter Learning¶

The EM Algorithm¶

E-Step¶

M-Step¶

Relation to KL Divergence¶

EM Applied to CPM¶

Calculating $\mathrm{E} [\log \pi_{t,k}]_{p(\pi_t|x_{1:T},\theta^{(t)})}$¶

Inverse Gamma Function¶

Implementation of EM Algorihm¶

Appendix A¶

Estimating Dirichlet Distribution¶