🧠 深度学习 · 8 分钟

CNN 怎么"看"图像

卷积神经网络（CNN）的核心是 卷积核（kernel）——一个小矩阵在图像上滑动，每个位置算出一个值。不同的 kernel 抽不同的特征：边缘、模糊、锐化……试试看：

选个卷积核：

输入图像：

输入图像 (10×10)

悬停看坐标 · 点击切换像素

卷积核 (3×3)

检测水平方向的灰度变化

点击数字可修改

特征图 (8×8)

每格 = kernel 在该位置算出的值

当前位置：— · 算出的值：—

单个位置的计算（点击输出图上任意格查看）

点击右侧"特征图"任意一格，看 3×3 区域和 kernel 怎么算出这一格的值。

🔑

每个输出位置的值 = 3×3 区域和 kernel 对应位置相乘后求和。这个操作叫"卷积"（实际上是相关，但工程上都这么叫）。

输出[i,j] = Σ 输入[i+a, j+b] × kernel[a, b]

🦅

真实 CNN 每层有 几十到几千个 kernel，每个抽一种特征。一张图过完 30 多层 CNN 后，前几层学到"边缘"，中层学到"眼睛/纹理"，最后几层学到"猫脸"——特征是层层抽象出来的。