思考: 神经网络层的功能识别

基本知识

卷积操作即为一系列滤波操作之和。 有关卷积的概念，具体可参加我的这篇文章：深度学习: convolution (卷积) 。

观察

初始化后的深度学习模型的训练就像一个婴孩。
在训练过程中，各网络层 总数不变，但在梯度下降的引导下，不断分化成各种 功能层 。各功能层协作，使得模型成熟而强大。

而每个神经网络层的 卷积核，其实就是 一系列的 filter（滤波器）集合 。

Zeiler 和 Fergus 两位大佬在他们获得ECCV2014最佳论文提名奖的论文《Visualizing and Understanding Convolutional Networks》中，就对各卷积层的 feature map（特征图） 展开了 可视化探究 。

Image may be NSFW.
Clik here to view. 这里写图片描述

但是他们却没有对生成各卷积层feature map 的 filter（滤波器） 展开 功能规律探究 。

Idea

训练好的模型中，各神经网络层weight参数初看起来像是一组乱序的tensor，但是既然他们能分化成各种 功能层 ，意味着他们一定会长得越来越像 该功能 所对应的 filter集合 。我之前在github上开源了一个关于图像滤波器的项目：Image_Filter 。可以看出，实现某种卷积操作（其实等同于某种滤波操作）以实现该特征抽取功能，那么所用到的卷积核（即为滤波器集合）一定会 近似于 某种滤波器集合。

Image may be NSFW.
Clik here to view. 这里写图片描述

例如，如果该功能层80%的功能是实现边缘提取，那么它的卷积核一定长得像加长版的边缘滤波器。

而各种边缘滤波器，长得又都类似：
（代码截取自Image_Filter）

def Edge_Detection_360_degree_Filter():
    # Edge_Detection_360° Filter  360°边缘检测 滤波 （抽取 边缘特征）
    filter_0 = np.array([[[-1,0,0],[-1,0,0],[-1,0,0]],
                         [[-1,0,0],[8,0,0],[-1,0,0]],
                         [[-1,0,0],[-1,0,0],[-1,0,0]]],
                        dtype=np.int16)
    filter_1 = np.array([[[0,-1,0],[0,-1,0],[0,-1,0]],
                         [[0,-1,0],[0,8,0],[0,-1,0]],
                         [[0,-1,0],[0,-1,0],[0,-1,0]]],
                        dtype=np.int16)
    filter_2 = np.array([[[0,0,-1],[0,0,-1],[0,0,-1]],
                         [[0,0,-1],[0,0,8],[0,0,-1]],
                         [[0,0,-1],[0,0,-1],[0,0,-1]]],
                        dtype=np.int16)
    return filter_0, filter_1, filter_2

def Edge_Detection_45_degree_Filter():
    # Edge_Detection_45° Filter  45°边缘检测 滤波 （抽取 边缘特征）
    filter_0 = np.array([[[-1,0,0],[0,0,0],[0,0,0]],
                         [[0,0,0],[2,0,0],[0,0,0]],
                         [[0,0,0],[0,0,0],[-1,0,0]]],
                        dtype=np.int16)
    filter_1 = np.array([[[0,-1,0],[0,0,0],[0,0,0]],
                         [[0,0,0],[0,2,0],[0,0,0]],
                         [[0,0,0],[0,0,0],[0,-1,0]]],
                        dtype=np.int16)
    filter_2 = np.array([[[0,0,-1],[0,0,0],[0,0,0]],
                         [[0,0,0],[0,0,2],[0,0,0]],
                         [[0,0,0],[0,0,0],[0,0,-1]]],
                        dtype=np.int16)
    return filter_0, filter_1, filter_2

那么意味着：

各 相同功能 的网络层，卷积核 一定 长得彼此类似 。

通过总结出各类功能层的 “大众脸”（即大众型卷积核的参数分布），即可找出规律。

Idea用途

可用于对训练好的 神经网络层 进行 功能识别 。

网络层功能识别具体步骤

总结出常用的几类功能滤波器（例如颜色特征抽取、边缘特征抽取、纹理特征抽取、肢干特征抽取、整体特征抽取）。

对要进行识别的网络层，输入该层训练好的卷积核。对维度进行 归一化 ，以保证要识别的 tensor 有一致的size。

将预处理过的待识别卷积核与常用的几类功能滤波器进行相似度比较。（比如通过l2范数，求得各位置上对应参数值的距离差异）

通过比较结果得出该卷积核的分类情况，如下图：

颜色特征提取	边缘特征提取	纹理特征提取	肢干特征提取	整体特征提取
2%	10%	80%	8%	2%

从而通过最大概率，判定该功能层为 纹理特征提取层 。

当然，也可通过 大于10%概率阈值 的筛选方法，判定其为 （80%纹理+10%边缘）特征提取层 。

作者：JNingWei 发表于2018/1/4 21:53:09 原文链接

阅读：125 评论：0 查看评论

思考: 神经网络层的功能识别

基本知识

观察

Idea

那么意味着：

Idea用途

网络层功能识别具体步骤

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本

基本知识

观察

Idea

那么意味着：

Idea用途

网络层 功能识别 具体步骤

Trending Articles

网络层功能识别具体步骤