百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

基于双目立体视觉的图像增强

moboyou 2025-05-18 14:21 5 浏览

摘 要: 户外视觉系统采集图像时,容易受到低照度等因素的影响,导致捕获的图像退化,视见度降低。本文提出了一种基于双目立体视觉的图像增强算法。该算法首先通过立体匹配处理求解场景视差图像,然后构建广义双边滤波估计图像照度分量,根据Retinex原理求解图像反射分量,实现图像的增强。实验证明,该算法能够有效地改善图像质量,提高双目视觉系统工作的鲁棒性和可靠性。

0 引言

双目立体视觉直接模拟人类双眼处理景物的方式,可靠简便,在许多领域均极具应用价值,如人机交互、视频监控、智能控制、三维测量、机器人导航与航测以及虚拟现实等。双目立体视觉是计算机视觉的一个重要分支,其原理是由不同位置的两台摄像机或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,通过计算机空间点在两幅图像中的视差,获得该点的三维坐标值。

目前,对于双目立体视觉的研究主要集中在特征匹配[1-2]、摄像机标定、三维重建[3]等方面,对于图像增强领域却鲜有研究。在实际应用中,普遍采用单幅图像的图像增强算法,这类方法对图像全局进行统一处理,由于没有考虑场景的景深情况,不能充分校正不同景深区域的对比度和颜色。

针对这个问题,本文提出了一种基于双目立体视觉的图像增强算法,主要针对低照度图像进行处理。该算法首先进行立体匹配操作求解视差图像,通过视差图像反映场景的深度信息。根据Retinex原理[4],将视差图像作为反映场景深度的先验信息,构建广义双边滤波估计图像的照度分量,从而获得含物体本身特性的反射分量,即增强后的清晰图像。本文算法假设场景深度变化主要在于边缘区域,而非边缘区域深度变化平缓。最后通过实验证明该算法能够利用估计的视差信息,充分恢复不同景深的场景颜色与细节信息。

1 本文算法

1.1 双目立体视觉系统

双目立体视觉的基本原理是从两个视点观察同一景物,获取两幅同一场景的图像,根据像素点的相似性计算求解图像像素间的位置偏差(视差),从而根据三角形法原理确定三维空间点的深度信息,进而重建景物,这一过程与人类视觉的立体感知过程相类似。

双目视觉系统如图1所示,焦点分别为O1和O2的两台摄像机具有相同的参数性能,同时光轴互相平行、X轴互相重合、Z轴与左摄像机的光轴重合,两个摄像机焦距均为f,它们之间的距离为B,I1和I2为左右摄像机的像平面,P1和P2分别是空间点在左右像平面上的成像点。由相似三角形关系可导出深度信息方程:

式中,d=pl-pr为两幅图的视差,焦距f通过摄像机标定求得。

在双目立体视觉系统中,立体匹配与三维重建等方面的研究最多,而对于图像增强方面的研究也具有重要的理论与实际意义,它直接影响到匹配操作的精度和速度,同时,通过削弱场景中诸多因素的干扰,如光照条件,能够为最终的三维重建打下坚实的基础。

由公式(1)可知,通过对左右图像进行特征匹配,就可以得到其视差信息,结合已知信息B和f,即可获得场景中目标的深度。因此,本文假设图像包含的视差信息能够较好地反应场景深度,将视差信息作为反映场景深度的先验信息施加到图像增强处理过程中。

1.2 立体匹配

立体匹配是寻找同一空间景物在不同视点下投影图像中像素间的一一对应关系,一般包括匹配代价计算、代价值聚集、视差计算等步骤[5-6]。本文采用自适应的方法,结合SAD(Sum of Absolute Differences)和梯度特征的相似性测度因子[6]进行匹配代价计算,即:

式中,x表示图像像素,N(x)是在x处的3×3的包围窗口,NH(x)是不包含最左一列的包围窗口,NV(x)是不包含最下一行的包围窗口。

H表示水平梯度,

V表示垂直梯度。此时,匹配代价函数可以表示为:

其中,

是最优权值,由最大化可靠对应像素的数量来决定,可靠像素是通过胜者为王(Winner-Takes-All,WTA)准则来过滤的,公式(4)经过阈值法[6]处理之后最终得到初始视差图像为

。在视差图像计算方面,为了优化其结果,需要对视差图像进行平滑操作,下面采用的是选择性模式滤波器(Selective Mode Filter)[7],从而获得理想的视差图像结果D。本文将视差图像D引入到图像增强操作中来。

1.3 基于Retinex原理的图像增强处理

基于Retinex理论提出来的图像增强方法具有高动态范围压缩、局部对比度增强、保持图像颜色恒常性等优点[4]。

Retinex理论认为一幅图像可分为两部分,即一幅图像I可由反射分量R和照度分量L的乘积表示,即:

I(x)=R(x)L(x)(5)

其中,照度分量的性质取决于光源,决定了图像的动态范围;反射分量的性质则取决于成像物体的特性,主要反映了图像的细节信息。Retinex原理的思想实际上就是去除或减少照度分量的影响,获得包含较多细节信息的反射分量。其计算过程在对数域上进行:

logR(x)=logI(x)-logL(x)(6)

上述反射分量的求解在数学上是一个奇异问题,因此需要把求解问题变成约束最优化问题,通过对照度分量的准确估计进行反射分量的求解。由于照度分量具有局部平滑的性质,因此对它的估计可以看作为平滑问题,本文采用广义双边滤波求解照度分量。

双边滤波的理论是Tomasi和Manduchi[8]于1998年提出的,该理论同时考虑了空间邻近度与像素值相似度,是一种边缘保持的非迭代平滑滤波方法。本文采用的广义双边滤波则是结合了视差值相似度与像素值相似度进行平滑操作,其形式定义为:

式中,

为高斯函数,表示随着视差值差异以及灰度差值的增大,图像像素的权重逐渐减小。

公式(6)、(7)的计算需要将图像由RGB颜色空间转换到HSV(Hue,Saturation,Value)颜色空间下,仅对亮度分量进行处理,而获得的饱和分量与色调分量保持不变,在获得反射分量后,再将图像由HSV颜色空间转换到RGB颜色空间,即可获得增强后的图像。

2 实验仿真与分析

为验证本文算法的有效性,在MATLAB平台上进行图像处理实验,主要针对低照度图像进行处理。图2(a)、(b)为存在视差的参考图像;(c)为获得的初始视差图像;(d)为优化后的视差图像;(e)为图(b)的照度分量;(f)为图(b)的图像增强结果。通过实验可知,本文算法能够根据场景深度的差异,再现场景的真实颜色,以及增强低照度区域的细节信息。

3 结论

本文将双目立体视觉原理应用于低照度图像的增强上,将视差图像作为场景深度的先验信息,在估计图像照度分量的时候,提供了约束条件,构建了广义双边滤波,更加充分地恢复了图像细节信息。该算法具有较高的鲁棒性,能够较好地改善双目视觉系统的工作能力,具有广泛的应用前景。

参考文献

[1] 岳陈平,孟丽娅.基于SAD算法的立体匹配的实现[J].微型机与应用,2013,32(6):41-43.

[2] 欧阳鑫玉,张娟娟,赵楠楠,等.基于NCC的改进立体匹配算法[J].微型机与应用,2015,34(3):54-57.

[3] 赵宏宇,李燕华,侯振杰,等.基于鲁棒估计灭点分层重建的研究[J].微型机与应用,2011,30(9):31-35.

[4] 肖创柏,赵宏宇,禹晶.基于引导滤波的Retinex快速夜间彩色图像增强技术[J].北京工业大学学报,2013,39(12):1868-1873.

[5] SCHARSTEIN D, SZELISKI R. Stereo matching with nonlinear diffusion[J]. International Journal of Computer Vision, 1998,28(2):155-174.

[6] KLAUS A, SORMANN M, KARNER K. Segment-based stereo matching using belief propagation and a self-adapting dissimilarity measure[C]. 18th International Conference on Pattern Recognition, 2006:15-18.

[7] LANKTON S. Selective mode filter in Matlab[EB/OL]. (2008-04-12)[2015-05-13]. Http://www.shawnlankton.com, 2008-04-12.

[8] TOMASI C, MANDUCHI R. Bilateral filtering for gray and color images[C]. In: Proceedings of the 6th International Conference on Computer Vision Bombay, India: IEEE, 1998: 839-846.

相关推荐

人工智能所有必要的数学概念:机器学习和深度学习

人工智能和数学之间的这种联系的快速概述是:缺乏数学技能的人工智能专家相当于缺乏说服力的政治家。每个人都有一个需要关注的领域!我不会进一步详细说明理解数学对AI的重要性,而是直奔本文的要点。为AI...

「数学」微分方程第一步,吃透概念-复数,多项式方程及矩阵理论

最近我开启了“量子力学之路”系列,旨在从数理角度从零解释量子力学。正如我在系列的第一篇文章量子力学之路——坚实的数理基础至关重要,没有捷径可走中提到的那样,学习量子力学有一些先决条件,而一些先决条件并...

量子计算(七):量子系统

量子系统前言对于一个非物理专业的人而言,量子力学概念晦涩难懂。鉴于此,本文仅介绍量子力学的一些基础概念加之部分数学的相关知识,甚至不涉及薛定谔方程,就足够开始量子计算机的应用。这如同不需去了解CPU的...

什么是正定矩阵?它的几何解释有助于我们直观地理解它。

正定矩阵定义为每个特征值为正的对称矩阵。好吧,但你可能想知道,“我们为什么要定义这样的东西?它在某种程度上有用吗?为什么特征值的符号很重要?”这很好,但是你能提供更多的想法来支持它吗?正定矩阵的几何解...

实对称矩阵的几个性质

实对称矩阵是一种非常重要的矩阵,这里列出它的几个重要性质,以供参考:证明过程中用到的方法就是取转置和共轭,以及两个复数乘积的共轭等于两个复数共轭的乘积的性质。因为A是对称阵,所以A可以相似对角化,A=...

三分钟秒懂矩阵的所有概念

(1)矩阵矩阵就像是一幅由许多小格子组成的画,每个格子都是一个颜色或图案。比如,一个17x11的矩阵画就是一个17行11列的画,每个小格子都有不同的颜色或图案。(2)矩阵的秩秩就像是画中的“独立颜色数...

大一新生开发的小工具火了!可视化Python编程体验了解一下

鱼羊发自凹非寺量子位报道|公众号QbitAI普普通通黑底白字地敲代码太枯燥?那么,把Python脚本可视化怎么样?就像这样,从输入图片、调整尺寸到双边滤波,每一步都能看得清清楚楚明明白白。...

Python 数据分析——SciPy 线性代数-linalg

NumPy和SciPy都提供了线性代数函数库linalg,SciPy的线性代数库比NumPy更加全面。一、解线性方程组numpy.linalg.solve(A,b)和scipy.linalg.sol...

广义切比雪夫滤波器函数综合

主要分享《通信系统微波滤波器——基础、设计与应用》书籍中相关章节的个人理解与感悟,如有错误欢迎批评指正!这一节主要计算广义切比雪夫滤波器的多项式函数。如果一个二端口网络是无耗并且互易的,则S参数矩阵可...

基于基扩展模型的LTE-R信道估计算法

邓玲,陈忠辉,赵宜升(福州大学物理与信息工程学院,福建福州350108)摘要:针对LTER通信系统,对快时变信道估计问题进行了研究。采用基扩展模型对高速铁路通信环境的快时变信道进行拟合,将信道冲...

一种基于相干波束形成的零陷加宽算法

摘要:针对干扰信号和期望信号相干导致“干扰欠相消”以及由于干扰扰动而无法去除的问题,提出了一种基于前后向空间平滑的零陷加宽算法。该算法首先通过前后空间平滑方法去相干,并利用最佳下降的递推方法求得最...

[高等数学] 矩阵的奇异值分解的详细证明及计算实例

[高等数学]矩阵的奇异值分解的详细证明及计算实例目录1定义及介绍2详细证明3计算实例4程序正文1定义及介绍奇异值分解(SingularValueDecomposition,SVD)是...

运动控制功能开了挂的S7-200 SMART V3-凸轮功能

1、S7-200SMARTV3凸轮功能限制2、组态凸轮电子凸轮根据预定义的电子凸轮表,使用脉冲串控制从轴与主轴同步凸轮表是一份数据表,用于指定跟随主轴移动的从轴的位置。水平轴代表主轴相位,而垂直轴...

平均7倍实测加速,MIT提出高效、硬件友好的三维深度学习方法

机器之心发布机器之心编辑部随着三维深度学习越来越成为近期研究的热点,基于栅格化的数据处理方法也越来越受欢迎。但这种处理方法往往受限于高分辨下巨大的内存和计算开销,因此麻省理工学院HANLab的研...

Python数学建模系列(四):数值逼近

若文中数学公式显示有问题可查看文章原文Python数学建模系列(四):数值逼近菜鸟学习记:第四十二天1.一维插值插值:求过已知有限个数据点的近似函数。插值函数经过样本点,拟合函数一般基于最小二乘法...