当你想要评估一个函数在一个分布上的期望,但是无法从这个期望直接采样,于是从另一个分布去采样,然后计算在上的期望,因为是从上进行采样的,所以需要一个权重去修正。这种修正的方法就叫重要性采样,下面将详细介绍其数学原理和应用
理解熵,交叉熵与KL散度是迈入信息论和众多机器学习算法大门的关键。有太多人知道如何计算交叉损熵损失函数,但是从来不知道为何要这样计算。就好像能看懂乐谱,却无法直接从乐谱听到音乐。本文将由浅入深的介绍这三个概念。
在训练智能体的时候,智能体的动作不确定性会随着训练进度逐渐下降,这种不确定性通常用熵(entropy)来衡量。本篇博客将会介绍一下高斯熵公式的概念和理解。