Layer Normalization and RMSNorm
预备知识:Batch Normalization 1 Batch Normalization局限性 假设把中国的收入水平进行标准化(变成标准正态分布),这时中国高收入人群的收入值接近3,中收入人群的收入值接近0,低收入人群接近-3。不难发现,标准化后的相对大小是不变的,即中国富人的收入水平在标准化前和标准化后都比中国穷人高。把中国的收入水平看成一个…
thumbnail
Batch Normalization
为什么要使用Batch Normalization? 使用浅层模型时,随着模型训练的进行,当每层中参数更新时,靠近输出层的输出较难出现剧烈变化。对深层神经网络来说,随着网络训练的进行,前一层参数的调整使得后一层输入数据的分布发生变化,各层在训练的过程中就需要不断的改变以适应学习这种新的数据分布。所以即使输入数据已做标准化,训练中模型参数的更新依然很…
thumbnail
I Can Find You! Boundary-Guided Separated Attention Network for Camouflaged Object Detection
论文地址:I Can Find You! Boundary-Guided Separated Attention Network for Camouflaged Object Detection 1 论文要解决的问题 我们人类在辨别那些伪装目标的时候,通常是先发现出前景和背景之间的微小区别,当逐渐发现他们之间的区别时,借此可以一步步发现边缘,然后通…
WordPress如何在文章中添加latex数学公式
1 下载插件 在Wordpress插件中下载MathJax-LaTeX,并启用(不要忘记启用!!!) 2 在文章中插入公式 图片识别公式转为latex的网站:simpletex 2.1 行内公式 使用截图工具截出你想添加的公式,比如我想要在当前行内添加数学式子: 把图片复制/上传到网站上 如果我们想要在行内写公式,则要复制圆形括号格式的latex,…
Inductive Bias
1 No Free Lunch Theorem “没有午餐定理”(简称NFL定理),意思就是,一个任务的分布\(f\)是均匀分布,那么对于任何两个机器学习算法\(\mathfrak{L}_{a}\)与\(\mathfrak{L}_{b}\),无论\(\mathfrak{L}_{a}\)多么聪明,\(\mathfrak{L}_{b}\)多么笨,他们的…
thumbnail
Mutual Graph Learning for Camouflaged Object Detection
论文地址:Mutual Graph Learning for Camouflaged Object Detection 1 研究动机 现在的伪装目标检测一般分为两块,一是伪装目标的识别,二是伪装目标轮廓的检测,前者通常是主任务,后者通常是辅助任务,下图中,左图是轮廓检测,右图是伪装目标识别(区域检测) 现在的大多数模型中,伪装目标识别(COD)与轮…
thumbnail
MacOS解决环境变量重启终端后失效问题
MacOS配置环境变量通常在用户主目录下的.bash_profile下进行配置,这个文件无法通过ls命令查看,必须通过ls -al才能查看,因为该文件是隐藏的,通常新电脑是没有.bash_profile这个文件的,我们需要在用户主目录下touch .bash_profile下创建该文件。 但当我们在.bash_profile配置环境变量之后,重启终…
thumbnail
Homebrew
Homebrew :brew 程序所在路径,homebrew 的仓库位置默认位于/usr/local/Homebrew 下 Cellar :文件夹存放的是所有包安装所在路径,包括二进制,文档和配置文件,按照这样 Cellar/包名/版本号/ 的形式来安放。 opt :由于版本号随着跟新而改变的,所以需要一个固定不变的路径作为我们访问二进制和文档的路…
thumbnail
Attention Is All You Need(Transformer)
原论文链接:Attention Is All You Need 1 背景 在机器转录和语言建模上,RNN和CNN都有着广泛的应用。在RNN中,输入是按照顺序一个个输入进网络进行计算,encoder每个节点计算得到hidden state作为下一时刻的输入,decoder也是如此,一个词一个词往外蹦,但是这种模型无法进行并行化计算,并且当序列比较长的…