本文共 12544 字,大约阅读时间需要 41 分钟。
图象边缘检测中边界闭合性的分析与探讨
边缘提取以及边缘增强是不少图像处理软件都具有的基本功能,它的增强效果很明显,在用于
识别的应用中,图像边缘也是非常重要的特征之一。图像边缘保留了原始图像中相当重要的部分信息,而又使得总的数据量减小了很多,这正符合特征提取的要求。在以后要谈到的霍夫变换(检测图像中的几何形状)中,边缘提取就是前提步骤。 这里我们只考虑灰度图像,用于图像识别的边缘提取比起仅仅用于视觉效果增强的边缘提取要复杂一些。要给图像的边缘下一个定义还挺困难的,从人的直观感受来说,边缘对应于物体的边界。图像上灰度变化剧烈的区域比较符合这个要求,我们一般会以这个特征来提取图像的边缘。但在遇到包含纹理的图像上,这有点问题,比如说,图像中的人穿了黑白格子的衣服,我们往往不希望提取出来的边缘包括衣服上的方格。但这个比较困难,涉及到纹理图像的处理等方法。 好了,既然边缘提取是要保留图像的灰度变化剧烈的区域,从数学上,最直观的方法就是微分(对于数字图像来说就是差分),在信号处理的角度来看,也可以说是用高通滤波器,即保留高频信号。这是最关键的一步,在此之前有时需要对输入图像进行消除噪声的处理。 用于图像识别的边缘提取往往需要输出的边缘是二值图像,即只有黑白两个灰度的图像,其中一个灰度代表边缘,另一个代表背景。此外,还需要把边缘细化成只有一个像素的宽度。总的说来边缘提取的步骤如下: 1,去噪声 2,微分运算 3,2值化处理 4,细化 第二步是关键,有不少书把第二步就直接称为边缘提取。实现它的算法也有很多,一般的图像处理教科书上都会介绍好几种,如拉普拉兹算子,索贝尔算子,罗伯特算子等等。这些都是模板运算,首先定义一个模板,模板的大小以3*3的较常见,也有2*2,5*5或更大尺寸的。运算时,把模板中心对应到图像的每一个像素位置,然后按照模板对应的公式对中心像素和它周围的像素进行数学运算,算出的结果作为输出图像对应像素点的值。 需要说明的是,模板运算是图像的一种处理手段--邻域处理,有许多图像增强效果都可以采用模板运算实现,如平滑效果,中值滤波(一种消除噪声的方法),油画效果,图像的凹凸效果等等。这些算法都比较简单,为人们常用。 关于前面提到的几种边缘提取算子(拉普拉兹算子,索贝尔算子,罗伯特算子),教科书上都有较为详细的介绍,我这里不多说了,(手头上没有教科书,也懒得翻译英文资料),如果你们有时间,可以把这些方法的具体情况仔细介绍一下。这里对拉普拉兹算子和索贝尔算子补充两句。拉普拉兹算子是2阶微分算子,也就是说,相当于求取2次微分,它的精度还算比较高,但对噪声过于敏感(有噪声的情况下效果很差)是它的重大缺点,所以这种算子并不是特别常用。索贝尔算子是最常用的算子之一(它是一种一阶算子),方法简单效果也不错,但提取出的边缘比较粗,要进行细化处理。另外,索贝尔算子也可提取出图像边缘的方向信息来,有文章论证过,在不考虑噪声的情况下,它取得的边缘信息误差不超过7度。 顺便说一句,往往我们在进行边缘提取时只注意到位置信息,而忽略了边缘的方向。事实上,图像的边缘总有一定的走向,我们可以用边缘曲线的法线方向(和切线垂直的直线)来代表边缘点的方向。在图像识别的应用中,这个方向是非常重要的信息。 上面的几种算子是属于比较简单的方法,边缘提取的精度都不算特别高,下面介绍几种高级算法。首先是马尔(Marr)算子,马尔是计算机视觉这门学问的奠基人,很了不起,但这些理论很难懂。他提出的边缘提取方法可以看成两个步骤,一个是平滑作用来消除噪声,另一个是微分提取边缘,也可以说是由两个滤波器组成,低通滤波去除噪声,高通滤波提取边缘。人们也称这种方法为LOG滤波器,这也是根据它数学表达式和滤波器形状起的名字。也可以采用模板运算来实现这种算法,但模板的大小一般要在7*7以上,所以运算复杂程度比索贝尔算子等要大不少,运算时间当然也长许多。 另外一种非常重要的算法是坎尼(Canny)算子,这是坎尼在1986年写的一篇论文里仔细论述的。他给出了判断边缘提取方法性能的指标。而坎尼算子也是图像处理领域里的标准方法,也可以说是默认的方法。比较奇怪的是,国内的图像处理教科书中,介绍坎尼算子的很少。本人见过的书中,郑南宁的‘计算机视觉与模式识别’(1998年),算是介绍的比较详细的。坎尼算子在使用时要提供给一些参数,用于控制算法的性能,实际上,对于不同的图像或不同的边缘提取目的,应该提供不同的参数,以达到最佳效果。它也有模板运算方法,模板的大小也比较大,和提供的参数有关,标准的大小差不多是17*17,可以根据算子的可分离性用快速算法(否则就会慢的一塌糊涂),坎尼算子的2值化也很有特色,具有一定的智能性。 还有一种算法:Shen-Castan算子,大概可称为沈峻算子,总之是中国人的成果,效果和坎尼算子不相上下,这种算法在对边缘提取好坏的判别标准上有些不同。(这种方法我没用过,好象编起程序来,要比坎尼算子还复杂) 在实际的图像处理与识别应用中,有时需要根据被处理图像的种类以及实际目的,量身定做算法,边缘提取也是一样,但是基本原理都是一样的。canny算子代码
void CreatGauss(double sigma, double **pdKernel, int *pnWidowSize);
void GaussianSmooth(SIZE sz, LPBYTE pGray, LPBYTE pResult, double sigma);
void Grad(SIZE sz, LPBYTE pGray, int *pGradX, int *pGradY, int *pMag);
void NonmaxSuppress(int *pMag, int *pGradX, int *pGradY, SIZE sz, LPBYTE pNSRst);
void EstimateThreshold(int *pMag, SIZE sz, int *pThrHigh, int *pThrLow, LPBYTE pGray,
double dRatHigh, double dRatLow);void Hysteresis(int *pMag, SIZE sz, double dRatLow, double dRatHigh, LPBYTE pResult);
void TraceEdge(int y, int x, int nThrLow, LPBYTE pResult, int *pMag, SIZE sz);
void Canny(LPBYTE pGray, SIZE sz, double sigma, double dRatLow,
double dRatHigh, LPBYTE pResult);#include "afx.h"
#include "math.h"#include "canny.h"// 一维高斯分布函数,用于平滑函数中生成的高斯滤波系数
void CreatGauss(double sigma, double **pdKernel, int *pnWidowSize){LONG i;
//数组中心点
int nCenter;//数组中一点到中心点距离
double dDis;//中间变量
double dValue; double dSum; dSum = 0;// [-3*sigma,3*sigma] 以内数据,会覆盖绝大部分滤波系数
*pnWidowSize = 1+ 2*ceil(3*sigma);nCenter = (*pnWidowSize)/2;
*pdKernel = new double[*pnWidowSize];
//生成高斯数据
for(i=0;i<(*pnWidowSize);i++) { dDis = double(i - nCenter); dValue = exp(-(1/2)*dDis*dDis/(sigma*sigma))/(sqrt(2*3.1415926)*sigma); (*pdKernel)[i] = dValue; dSum+=dValue;}
//归一化 for(i=0;i<(*pnWidowSize);i++) { (*pdKernel)[i]/=dSum; }}
//用高斯滤波器平滑原图像
void GaussianSmooth(SIZE sz, LPBYTE pGray, LPBYTE pResult, double sigma){ LONG x, y; LONG i;//高斯滤波器长度
int nWindowSize;//窗口长度
int nLen;//一维高斯滤波器
double *pdKernel;//高斯系数与图像数据的点乘
double dDotMul; //滤波系数总和 double dWeightSum; double *pdTemp; pdTemp = new double[sz.cx*sz.cy];//产生一维高斯数据
CreatGauss(sigma, &pdKernel, &nWindowSize);nLen = nWindowSize/2;
//x方向滤波 for(y=0;y<sz.cy;y++) { for(x=0;x<sz.cx;x++) { dDotMul = 0; dWeightSum = 0; for(i=(-nLen);i<=nLen;i++) { //判断是否在图像内部 if((i+x)>=0 && (i+x)<sz.cx) { dDotMul+=(double)pGray[y*sz.cx+(i+x)] * pdKernel[nLen+i]; dWeightSum += pdKernel[nLen+i]; } } pdTemp[y*sz.cx+x] = dDotMul/dWeightSum; } }//y方向滤波
for(x=0; x<sz.cx;x++) { for(y=0; y<sz.cy; y++) { dDotMul = 0; dWeightSum = 0; for(i=(-nLen);i<=nLen;i++) { if((i+y)>=0 && (i+y)< sz.cy) { dDotMul += (double)pdTemp[(y+i)*sz.cx+x]*pdKernel[nLen+i]; dWeightSum += pdKernel[nLen+i]; } } pResult[y*sz.cx+x] = (unsigned char)dDotMul/dWeightSum; } }delete []pdKernel;
pdKernel = NULL;delete []pdTemp;
pdTemp = NULL;}
// 方向导数,求梯度
void Grad(SIZE sz, LPBYTE pGray,int *pGradX, int *pGradY, int *pMag){ LONG y,x;//x方向的方向导数
for(y=1;y<sz.cy-1;y++) { for(x=1;x<sz.cx-1;x++) { pGradX[y*sz.cx +x] = (int)( pGray[y*sz.cx+x+1]-pGray[y*sz.cx+ x-1] ); } }//y方向方向导数
for(x=1;x<sz.cx-1;x++) { for(y=1;y<sz.cy-1;y++) { pGradY[y*sz.cx +x] = (int)(pGray[(y+1)*sz.cx +x] - pGray[(y-1)*sz.cx +x]); } }//求梯度
//中间变量
double dSqt1; double dSqt2;for(y=0; y<sz.cy; y++)
{ for(x=0; x<sz.cx; x++) { //二阶范数求梯度 dSqt1 = pGradX[y*sz.cx + x]*pGradX[y*sz.cx + x]; dSqt2 = pGradY[y*sz.cx + x]*pGradY[y*sz.cx + x]; pMag[y*sz.cx+x] = (int)(sqrt(dSqt1+dSqt2)+0.5); } }}//非最大抑制
void NonmaxSuppress(int *pMag, int *pGradX, int *pGradY, SIZE sz, LPBYTE pNSRst){ LONG y,x; int nPos;//梯度分量
int gx; int gy;//中间变量
int g1,g2,g3,g4; double weight; double dTmp,dTmp1,dTmp2;//设置图像边缘为不可能的分界点
for(x=0;x<sz.cx;x++) { pNSRst[x] = 0; pNSRst[(sz.cy-1)*sz.cx+x] = 0;}
for(y=0;y<sz.cy;y++) { pNSRst[y*sz.cx] = 0; pNSRst[y*sz.cx + sz.cx-1] = 0; }for(y=1;y<sz.cy-1;y++)
{ for(x=1;x<sz.cx-1;x++) { //当前点 nPos = y*sz.cx + x;//如果当前像素梯度幅度为0,则不是边界点
if(pMag[nPos] == 0) { pNSRst[nPos] = 0; } else { //当前点的梯度幅度 dTmp = pMag[nPos];//x,y方向导数
gx = pGradX[nPos]; gy = pGradY[nPos];//如果方向导数y分量比x分量大,说明导数方向趋向于y分量
if(abs(gy) > abs(gx)) { //计算插值比例 weight = fabs(gx)/fabs(gy);g2 = pMag[nPos-sz.cx];
g4 = pMag[nPos+sz.cx];//如果x,y两个方向导数的符号相同
//C 为当前像素,与g1-g4 的位置关系为: //g1 g2 // C // g4 g3 if(gx*gy>0) { g1 = pMag[nPos-sz.cx-1]; g3 = pMag[nPos+sz.cx+1]; }//如果x,y两个方向的方向导数方向相反
//C是当前像素,与g1-g4的关系为: // g2 g1 // C // g3 g4 else { g1 = pMag[nPos-sz.cx+1]; g3 = pMag[nPos+sz.cx-1]; } }//如果方向导数x分量比y分量大,说明导数的方向趋向于x分量
else { //插值比例 weight = fabs(gy)/fabs(gx);g2 = pMag[nPos+1];
g4 = pMag[nPos-1];//如果x,y两个方向的方向导数符号相同
//当前像素C与 g1-g4的关系为 // g3 // g4 C g2 // g1 if(gx * gy > 0) { g1 = pMag[nPos+sz.cx+1]; g3 = pMag[nPos-sz.cx-1]; } //如果x,y两个方向导数的方向相反 // C与g1-g4的关系为 // g1 // g4 C g2 // g3 else { g1 = pMag[nPos-sz.cx+1]; g3 = pMag[nPos+sz.cx-1]; } }//利用 g1-g4 对梯度进行插值
{ dTmp1 = weight*g1 + (1-weight)*g2; dTmp2 = weight*g3 + (1-weight)*g4;//当前像素的梯度是局部的最大值
//该点可能是边界点 if(dTmp>=dTmp1 && dTmp>=dTmp2) { pNSRst[nPos] = 128; } else { //不可能是边界点 pNSRst[nPos] = 0; } } } } }}// 统计pMag的直方图,判定阈值
void EstimateThreshold(int *pMag, SIZE sz, int *pThrHigh, int *pThrLow, LPBYTE pGray, double dRatHigh, double dRatLow){ LONG y,x,k;//该数组的大小和梯度值的范围有关,如果采用本程序的算法
//那么梯度的范围不会超过pow(2,10) int nHist[256];//可能边界数
int nEdgeNum;//最大梯度数
int nMaxMag;int nHighCount;
nMaxMag = 0;
//初始化
for(k=0;k<256;k++) { nHist[k] = 0; } //统计直方图,利用直方图计算阈值 for(y=0;y<sz.cy;y++) { for(x=0;x<sz.cx;x++) { if(pGray[y*sz.cx+x]==128) { nHist[pMag[y*sz.cx+x]]++; } } }nEdgeNum = nHist[0];
nMaxMag = 0;//统计经过“非最大值抑制”后有多少像素
for(k=1;k<256;k++) { if(nHist[k] != 0) { nMaxMag = k; }//梯度为0的点是不可能为边界点的
//经过non-maximum suppression后有多少像素 nEdgeNum += nHist[k];}
//梯度比高阈值*pThrHigh 小的像素点总书目
nHighCount = (int)(dRatHigh * nEdgeNum + 0.5);k=1;
nEdgeNum = nHist[1];//计算高阈值
while((k<(nMaxMag-1)) && (nEdgeNum < nHighCount)) { k++; nEdgeNum += nHist[k]; }*pThrHigh = k;
//低阈值
*pThrLow = (int)((*pThrHigh) * dRatLow + 0.5);}
//利用函数寻找边界起点
void Hysteresis(int *pMag, SIZE sz, double dRatLow, double dRatHigh, LPBYTE pResult){ LONG y,x;int nThrHigh,nThrLow;
int nPos;
//估计TraceEdge 函数需要的低阈值,以及Hysteresis函数使用的高阈值 EstimateThreshold(pMag, sz,&nThrHigh,&nThrLow,pResult,dRatHigh,dRatLow);//寻找大于dThrHigh的点,这些点用来当作边界点,
//然后用TraceEdge函数跟踪该点对应的边界 for(y=0;y<sz.cy;y++) { for(x=0;x<sz.cx;x++) { nPos = y*sz.cx + x;//如果该像素是可能的边界点,并且梯度大于高阈值,
//该像素作为一个边界的起点 if((pResult[nPos]==128) && (pMag[nPos] >= nThrHigh)) { //设置该点为边界点 pResult[nPos] = 255; TraceEdge(y,x,nThrLow,pResult,pMag,sz); }}
}//其他点已经不可能为边界点
for(y=0;y<sz.cy;y++) { for(x=0;x<sz.cx;x++) { nPos = y*sz.cx + x;if(pResult[nPos] != 255)
{ pResult[nPos] = 0; } } }}//根据Hysteresis 执行的结果,从一个像素点开始搜索,搜索以该像素点为边界起点的一条边界的
//一条边界的所有边界点,函数采用了递归算法// 从(x,y)坐标出发,进行边界点的跟踪,跟踪只考虑pResult中没有处理并且可能是边界// 点的像素(=128),像素值为0表明该点不可能是边界点,像素值为255表明该点已经是边界点void TraceEdge(int y, int x, int nThrLow, LPBYTE pResult, int *pMag, SIZE sz)
{ //对8邻域像素进行查询 int xNum[8] = {1,1,0,-1,-1,-1,0,1}; int yNum[8] = {0,1,1,1,0,-1,-1,-1};LONG yy,xx,k;
for(k=0;k<8;k++)
{ yy = y+yNum[k]; xx = x+xNum[k];if(pResult[yy*sz.cx+xx]==128 && pMag[yy*sz.cx+xx]>=nThrLow )
{ //该点设为边界点 pResult[yy*sz.cx+xx] = 255;//以该点为中心再进行跟踪
TraceEdge(yy,xx,nThrLow,pResult,pMag,sz); } }} // Canny算子void Canny(LPBYTE pGray, SIZE sz, double sigma, double dRatLow, double dRatHigh, LPBYTE pResult){ //经过高斯滤波后的图像 LPBYTE pGaussSmooth;pGaussSmooth = new unsigned char[sz.cx*sz.cy];
//x方向导数的指针
int *pGradX; pGradX = new int[sz.cx*sz.cy]; //y方向 int *pGradY; pGradY = new int[sz.cx*sz.cy]; //梯度的幅度 int *pGradMag; pGradMag = new int[sz.cx*sz.cy];//对原图高斯滤波
GaussianSmooth(sz,pGray,pGaussSmooth,sigma);//计算方向导数和梯度的幅度
Grad(sz,pGaussSmooth,pGradX,pGradY,pGradMag);//应用非最大抑制
NonmaxSuppress(pGradMag,pGradX,pGradY,sz,pResult);//应用Hysteresis,找到所有边界
Hysteresis(pGradMag,sz,dRatLow,dRatHigh,pResult);delete[] pGradX;
pGradX = NULL; delete[] pGradY; pGradY = NULL; delete[] pGradMag; pGradMag = NULL; delete[] pGaussSmooth; pGaussSmooth = NULL; }/*
void CChildWnd::OnCanny() { if (! m_fOpenFile) { return; } m_fDone = TRUE; RGBToGray(szImg, aRGB, aGray, BPP); Canny(aGray,szImg,0.1,0.9,0.76,aBinImg); ShowGrayImage("l",szImg,aBinImg);}//*/再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!
转载地址:http://uqwzi.baihongyu.com/