标签可视化下的文章 - 科学空间|Scientific Spaces

28 Jun

积分梯度：一种新颖的神经网络可视化方法

By 苏剑林 | 2020-06-28 | 80142位读者 | 引用

本文介绍一种神经网络的可视化方法：积分梯度（Integrated Gradients），它首先在论文《Gradients of Counterfactuals》中提出，后来《Axiomatic Attribution for Deep Networks》再次介绍了它，两篇论文作者都是一样的，内容也大体上相同，后一篇相对来说更易懂一些，如果要读原论文的话，建议大家优先读后一篇。当然，它已经是2016～2017年间的工作了，“新颖”说的是它思路上的创新有趣，而不是指最近发表。

笔者在中文情感分类上对积分梯度的实验效果（越红的token越重要）

笔者在中文情感分类上对积分梯度的实验效果（越红的token越重要）

所谓可视化，简单来说就是对于给定的输入$x$以及模型$F(x)$，我们想办法指出$x$的哪些分量对模型的决策有重要影响，或者说对$x$各个分量的重要性做个排序，用专业的话术来说那就是“归因”。一个朴素的思路是直接使用梯度$\nabla_x F(x)$来作为$x$各个分量的重要性指标，而积分梯度是对它的改进。然而，笔者认为，很多介绍积分梯度方法的文章（包括原论文），都过于“生硬”（形式化），没有很好地突出积分梯度能比朴素梯度更有效的本质原因。本文试图用自己的思路介绍一下积分梯度方法。

点击阅读全文...

分类：信息时代标签：积分, 梯度, 可视化阅读全文 27 评论

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

热门标签

随机文章

最近评论

笑雨: 请问神经网络的参数，多大的变动会处于将崩溃又未崩溃的极限点呀？不知道这个波动范围是不是有限的，...
笑雨: 请忽略这个提问。https://kexue.fm/archives/6051 这里写有
笑雨: 还是神经网络大病缠身了才找lipschitz条件，小感冒的时候只需要它哥哥就行了；如果自己扛过...
笑雨: 除了GAN，不知道对其他训练网络有没有好处
笑雨: 苏神，几乎每个神经网络都希望对x的邻域的各种输入，保持几乎同样的输出，抗噪声，是否我们只要训一...
asdasf: emmm我又多测了几次，在非方阵下，看起来矩阵越大，重建误差的差距越小。也符合文中的越稀疏越优...
笑雨: 苏神，我觉得momentum，adamW里头都有冲量，或者历史平均数。我想这些都是为了让模型的...
刘太臣: 按照这个思路，魔改flash-attention估计不太行，head_size的维度变为(51...
asdasf: 苏神，我仿照你的代码试了一下非方阵的monarch(评论里发不了代码，所以临时贴了一下。htt...
plc: 和Lora不同的是，FFN的隐藏宽度比较大，所以FFN应该把B的学习率设小。