您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给AI研习社-译站
发送

1

一文带你读懂图像处理工作原理

本文作者: AI研习社-译站 2018-11-22 10:46
导语:我发现的最令人惊奇的是如何使用微积分巧妙地计算图像边缘。

一文带你读懂图像处理工作原理

本文为 AI 研习社编译的技术博客,原标题 :

An Amazing Insight of How Image Processing Works

作者 | Bhanu Parashar

翻译 | 老赵    校对 | 酱番梨

整理 | 菠萝妹

原文链接:

https://medium.com/@bhanuparashar23/an-amazing-insight-of-how-image-processing-works-9b7a17aa42a4


对图像处理如何工作的理解

我发现的最令人惊奇的是如何使用微积分巧妙地计算图像边缘。

考虑一个黑白图像

一文带你读懂图像处理工作原理

在这里,我放大了一个小区域。

如你所见,它包含许多像素。

它可以表示为具有以下约束的2D矩阵:

  1.  在AijAij中,i表示像素的x坐标,j表示y坐标

  2. 左上角是坐标(0,0)

  3. x,即向右移动时增加,而y,j在向下移动时增加

  4.  AijAij的值范围为0到255,0表示黑色255表示白色

所以这个小区域的矩阵将是

一文带你读懂图像处理工作原理

现在只考虑矩阵的一行。

即:像这样的东西

一文带你读懂图像处理工作原理

表示为:

一文带你读懂图像处理工作原理

如果我们在图表上绘制它:

它会像

一文带你读懂图像处理工作原理

一文带你读懂图像处理工作原理

记住高值意味着更多的白色,低值意味着更多的黑色,范围从0到255。


  第1部分:现在有趣的开始

如果我们将这个图表区分开来,考虑到函数y = f(x),该怎么办?

这里y是值AijAij,x是矩阵的i(这里y是不同的)

那么让我们绘制它的衍生物

正如你可以看到,从白色到黑色的图像变化点,衍生物的值突然增加

如果我们进一步区分,即双重差异,该怎么办?

一文带你读懂图像处理工作原理

所以你可以看到变化区域的突然爆发。

让我们在图像行中标记点:

一文带你读懂图像处理工作原理

现在,如果我们将这个东西应用于所有行并标记双重导数的高值。

它沿着图像的边缘

同样也可以将它用于所有列,你将获得图像中的完整边缘。


  第2部分:数学实施(比上面更令人惊讶)

如何通过计算机将这种差异应用于图像:

一些数学家发现了一种叫做卷积的现象让我先解释一下:

考虑一个大的NxN矩阵和一个小的3x3矩阵:

一文带你读懂图像处理工作原理

这里,如果小矩阵的点积与大矩阵的所有3x3大小的部分完成。 点积表示每个元素乘以其各自的元素,例如。 131 *( - 1),162 * 0,232 * 1等。

结果保存在另一个矩阵中。

这个过程称为卷积,这里3x3矩阵是内核,它可以更大,但最常用的是3x3。

这种现象是,如果一个大矩阵与一个类似于核的核心区域进行卷积,则在结果矩阵中突出显示(值增加),而非相似区域变暗。

代表双重差异的内核是:

一文带你读懂图像处理工作原理

以上这些也称为Sobel Kernel


  第3部分:基于C ++的OpenCV实现

一文带你读懂图像处理工作原理

输出

一文带你读懂图像处理工作原理

通过使用高斯导数,Canny边缘检测去除噪声可以实现许多进步,这些可以在线轻松研究。

图像:除了提供链接的图像之外的所有图像都是由我捕获和编辑的。


它如何扩展到彩色图像

颜色通常表示为RGB值(这里是OpenCV,它是BGR)

B->蓝色,G->绿色,R->红色边缘检测通常在将彩色图像转换为黑白之后进行。

但是还有一种方法,Image可以转换为HSV色空间这里 H 代表 Hue,S 代表饱和度,V 代表值,即 H 代表颜色,S 代表强度,V 代表亮度。

因此,如果我们只采用H或Hue,我们可以找到边缘而不受阴影或光线的影响。

还有其他方法。雷锋网雷锋网雷锋网


想要继续查看该篇文章相关链接和参考文献?

长按链接点击打开或点击【一文带你读懂图像处理工作原理】:

http://ai.yanxishe.com/page/TextTranslation/1248


AI研习社每日更新精彩内容,观看更多精彩内容:

神经网络如何完成表征?

进入 kaggle 竞赛前 2% 的秘诀

如何极大效率地提高你训练模型的速度?

这 25 个开源机器学习项目,一般人我不告诉 Ta


等你来译:

五个很厉害的 CNN 架构 

这5种计算机视觉技术,刷新你的世界观 

神经网络和3D程序化生成的未来

使用TensorSpace.js来做神经网络的的3D可视化


AI研习社资料推荐:

一文带你读懂图像处理工作原理


雷峰网原创文章,未经授权禁止转载。详情见转载须知

一文带你读懂图像处理工作原理

分享:
相关文章

知情人士

AI研习社(yanxishe.com)译站频道,传播前沿人工智能知识,让语言不再成为学习知识的门槛。(原雷锋字幕组)
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说