云计算百科
云计算领域专业知识百科平台

每天五分钟深度学习PyTorch:卷积和池化后图片会有什么变化?

本文重点

卷积和池化,这两个词听起来像厨房里的操作——一个像“搅拌食材”,一个像“过滤汤汁”。实际上,它们在图像处理里干的事儿也差不多:卷积负责“提取特征”,池化负责“压缩信息”。经过这两步,图片会从“原始像素堆”变成更有“内涵”的特征图,就像把一堆散沙捏成有形状的雕塑。

卷积:给图片“装上显微镜”

想象你有一张猫咪的照片,像素密密麻麻堆在一起,直接看只能看到“毛茸茸的一片”。卷积的操作,就像拿显微镜在图片上“扫”一遍——不过这显微镜的“镜片”是可定制的,叫“卷积核”(也叫滤波器)。比如你想找猫咪的边缘,就选一个能检测边缘的卷积核;想找猫咪的纹理,就选一个能捕捉纹理的核。卷积核在图片上“滑动”,每到一个位置,就和对应区域的像素做“局部乘法”——比如卷积核是3×3的,就取图片上3×3的像素块,每个像素和核上的数相乘,再把结果加起来,得到一个新的数值。这个数值会填到输出图片的对应位置,所有位置扫完,就得到一张新的“特征图”。

举个例子:假设原图是黑白的猫咪脸,卷积核是“边缘检测器”(中间值高,四周值低)。当核扫到猫咪耳朵的边缘时,边缘两侧的像素值差异大(一边亮一边暗),相乘后的和也会很大,输出图上对应位置就会变亮;而扫到耳朵内部时,像素值变化小,输出图上对应位置就偏暗。最后得到的特征图,会像用铅笔勾了边一样,突出猫咪的轮廓。

卷积后的图片,尺寸可能会变小(如果卷积核不“补零”的话),但更重要的是,它不再是一堆原始像素,而是“有意义”的特征。比如原来的图片是“毛、眼睛、鼻子”的像素堆,卷积后可能变成“边缘、纹理、形状”的特征图——这些特征是机器理解图片的“语言”,比原始像素更接近“猫咪”的概念。

不过,卷积核的选择很关键。如果选错了核(比如用检测边缘的核去找颜色),输出图

赞(0)
未经允许不得转载:网硕互联帮助中心 » 每天五分钟深度学习PyTorch:卷积和池化后图片会有什么变化?
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!