HelloAI ← 可视化画廊
🧠 深度学习 · 8 分钟

CNN 怎么"看"图像

卷积神经网络(CNN)的核心是 卷积核(kernel)——一个小矩阵在图像上滑动, 每个位置算出一个值。不同的 kernel 抽不同的特征:边缘、模糊、锐化……试试看:

选个卷积核:
输入图像:
输入图像 (10×10)
悬停看坐标 · 点击切换像素
卷积核 (3×3)
检测水平方向的灰度变化
点击数字可修改
特征图 (8×8)
每格 = kernel 在该位置算出的值
当前位置: · 算出的值:
单个位置的计算(点击输出图上任意格查看)
点击右侧"特征图"任意一格,看 3×3 区域和 kernel 怎么算出这一格的值。
🔑

核心公式

每个输出位置的值 = 3×3 区域和 kernel 对应位置相乘后求和。 这个操作叫"卷积"(实际上是相关,但工程上都这么叫)。

输出[i,j] = Σ 输入[i+a, j+b] × kernel[a, b]
🦅

真实 CNN 怎么用

真实 CNN 每层有 几十到几千个 kernel,每个抽一种特征。 一张图过完 30 多层 CNN 后,前几层学到"边缘",中层学到"眼睛/纹理",最后几层学到"猫脸"——特征是层层抽象出来的