基于语义理解的三维重建
基于语义理解的三维重建
基于语义理解的三维重建
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>基于语义理解的三维重建</strong><br />
WangWei<br />
2012年2月28日<br />
共34页<br />
1
内容提要<br />
1.语义理解在三维重建中的作用<br />
2.Learning 3-D Scene Structure from a Single Still Image<br />
3.总结与展望<br />
共34页<br />
2
1.语义理解在三维重建中的作用<br />
共34页<br />
3
三维重建存在的问题<br />
存在问题:(基于特征点匹配的自下向上重建方法)<br />
遮挡问题导致相应部分点云重建失败。<br />
在缺乏纹理的区域,只能获得稀疏的点云,甚至不能获得点云。<br />
重复性纹理导致重建错误。<br />
基线过大导致重建错误。<br />
需要大量图片<br />
......<br />
解决思路:通过深层理解图像或点云中所包含的语义信息,或者由用<br />
户提供语义信息,指导三维重建过程或对三维重建结果进行优化。<br />
共34页<br />
4
语义层次模型 [1]<br />
视觉特征语义:也称低层语义,如图像的颜色、形状、纹理等低<br />
级视觉特征,与视觉感知直接相连。<br />
目标语义和空间关系语义:如房前有一棵树、桌上有个箱子等,<br />
需要识别和提取图像中的目标类别、目标之间的空间位置等关系,<br />
涉及到模式识别和逻辑推理的相关技术。<br />
高层语义:包括场景语义(如海滨、街道、室内等)、行为语义(如<br />
表演、超越、进攻等)和情感语义(如平静、和谐、振奋等)。<br />
[1]Deselaers T, Keeysers D, Ney H, Classification Error Rate for Quantitative Evaluation of Conten‐based<br />
Image Retrieval Systems, In Proc. Of International Conference on Pattern Recognition ( ICPR 2004), 2004, Vol.<br />
2, pp. 505‐508.<br />
共34页<br />
5
三维重建中的语义来源<br />
1.二维图像:图像中的目标所属类<br />
别、目标的几何特征、目标间的<br />
空间关系、图像整体空间结构等。<br />
目标相对大小<br />
遮挡关系<br />
纹理梯度<br />
亮度和阴影<br />
空气透视<br />
......<br />
共34页<br />
6
2.三维点云:点云中的目标(如直<br />
线、平面、曲面等)及目标间空间<br />
几何关系。<br />
点云拓朴结构<br />
3.用户交互:用户交互式输入的高<br />
层知识(如目标类别、目标间的空<br />
间关系、目标属性等)。<br />
共34页<br />
7
部分文献<br />
[cvpr2011]Semantic structure from motion<br />
[ICCV2011]Semantic Structure From Motion with Object and Point<br />
Interactions<br />
[ICCV2011]Classification and reconstruction of surfaces from point clouds<br />
of man‐made objects<br />
[SIGGRAPH2011]Context‐Based Search for 3D Models<br />
[SIGGRAPH2011]Characterizing Structural Relationships in Scenes Using<br />
Graph Kernels<br />
[CVPR2010]Growing semantically meaningful models for visual SLAM<br />
[SIGGRAPH2010]L., Sharf, A., Zhang, H., Cohen‐Or, D., Chen, B. 2010,<br />
SmartBoxes for Interactive Urban Reconstruction<br />
[ICCV09]Decomposing a Scene into Geometric and Semantically<br />
Consistent regions<br />
共34页<br />
8
2. Learning 3D scene structure from<br />
a single still image<br />
共34页<br />
9
1.将图片分割 [1] 成多个Superpixels,假定空间场景由<br />
许多很小的Planes组成,Superpixels与Planes相互<br />
对应。<br />
2.求取每个Superpixel特征向量及“边缘特征向<br />
量”(纹理、颜色等)。<br />
3.MRF模型化Planes参数之间、Superpixels特征向量<br />
与Planes参数之间的关系。<br />
基本思路<br />
4.采用监督学习的方式求取相关参数。<br />
5.求解MRF模型,并根据Planes参数进行场景重建。<br />
6.为提高重建精度,融入对象检测与识别方法。<br />
7.大场景重建时与常规SFM算法相结合。<br />
Superpixels<br />
3‐d Mesh<br />
[1][ICCV2004]P. Felzenszwalb and D. Huttenlocher, “Efficient Graph‐Based Image Segmentation,” Int’l J. Computer<br />
Vision, vol. 59, 2004. 共34页<br />
10
空间平面参数α 特征:<br />
1.对空间平面上任意点q,满足 <br />
2. 为摄像机中心到空间平面距离<br />
1<br />
<br />
3.任意射线R i(单位向量),空间点i的深度<br />
最终目标:argmax(P(α | x; θ))<br />
α:空间平面参数;<br />
x :Superpixel特征向量集<br />
θ:模型参数(机器学习)<br />
空间平面参数化<br />
T<br />
q<br />
1<br />
共34页<br />
d 1<br />
i<br />
R<br />
T<br />
i<br />
<br />
i<br />
11
MAP-MRF模型简述<br />
<br />
<br />
F<br />
f<br />
df<br />
d<br />
f<br />
P<br />
f<br />
f<br />
C<br />
f<br />
R )<br />
|<br />
(<br />
)<br />
,<br />
(<br />
)<br />
(<br />
*<br />
*<br />
贝叶斯风险:<br />
<br />
<br />
<br />
1<br />
0<br />
)<br />
,<br />
(<br />
*<br />
f<br />
f<br />
C<br />
<br />
<br />
f<br />
f<br />
if<br />
*<br />
otherwise<br />
)<br />
|<br />
(<br />
1<br />
)<br />
|<br />
(<br />
1<br />
)<br />
|<br />
( *<br />
*<br />
:<br />
:<br />
d<br />
f<br />
kP<br />
df<br />
d<br />
f<br />
P<br />
df<br />
d<br />
f<br />
P<br />
f<br />
f<br />
f<br />
f<br />
f<br />
f<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
)}<br />
(<br />
)<br />
|<br />
(<br />
{<br />
max<br />
arg<br />
)<br />
|<br />
(<br />
max<br />
arg<br />
)<br />
(<br />
min<br />
arg<br />
*<br />
*<br />
f<br />
P<br />
f<br />
d<br />
P<br />
d<br />
f<br />
P<br />
f<br />
R<br />
f<br />
F<br />
f<br />
F<br />
f<br />
F<br />
f <br />
<br />
<br />
<br />
<br />
<br />
(风险函数<br />
MAP估计:<br />
)<br />
1.MAP(最大后险概率)<br />
2.MAP‐MRF<br />
任意随机场为MRF随机场的充要条件:<br />
)<br />
(<br />
1<br />
1<br />
)<br />
(<br />
f<br />
U<br />
T<br />
e<br />
Z<br />
f<br />
P<br />
<br />
<br />
<br />
<br />
<br />
<br />
S<br />
i S<br />
i N<br />
i<br />
i<br />
i<br />
i<br />
i<br />
f<br />
f<br />
V<br />
f<br />
V<br />
f<br />
U<br />
'<br />
'<br />
2<br />
1<br />
)<br />
,<br />
(<br />
)<br />
(<br />
)<br />
(<br />
能量函数:<br />
12<br />
共34页
PLANE PARAMETER MRF模型(MAP-MRF)<br />
1<br />
P(<br />
X , , y,<br />
R,<br />
) f1<br />
( i<br />
| X i,<br />
vi,<br />
Ri;<br />
) f2<br />
( i<br />
, j |<br />
Z<br />
i<br />
i,<br />
j<br />
y<br />
i,<br />
j<br />
, R , R )<br />
f ( ) :表征Superpixel(以下简称SPi)特征向量与空间平面参数之间的统计相关性。 1 <br />
f ( ) :表征SP对应空间平面参数彼此之间的统计相关性。具体由SP之间的互连性、<br />
2 <br />
共面性、共线性、遮挡关系等几部分共同决定,而这些关系的决定通过衡量<br />
在相邻SP中所选择的不同像素点之间的关系来实现。即:<br />
s<br />
si j<br />
f<br />
2<br />
( )<br />
<br />
hsi<br />
, s<br />
{ s , s } N<br />
i<br />
j<br />
j<br />
( )<br />
其中, 、 为选择的像素,h为像素间的关系。<br />
i :SPi对应的空间平面参数 X i :SPi特征向量,即 524 x IR : s 1,<br />
S<br />
X i,<br />
s<br />
i<br />
i i ,<br />
R i :摄像机中心到SPi所包含的像素点射线集合,即 i :Spi估计深度的置信度 y i,<br />
j<br />
:SP i、SP j对应空间平面之间是否为遮挡关系的标记<br />
共34页<br />
R : s 1,<br />
S<br />
R i,<br />
s i<br />
i i ,<br />
i<br />
j<br />
13
特征与深度关系<br />
基本思路:图像某区域特征(纹理、颜色、边缘等)在一定程度上与该<br />
区域相应的空间平面的深度、方向等信息相关。<br />
设 ' 为SPi中像素si对应的估计深度, d<br />
其与si的特征向量之间存在如下关系: T<br />
x i,<br />
k<br />
'<br />
d x <br />
T<br />
, s<br />
i i<br />
:SP i中第s i个像素的特征向量<br />
r :模型参数(机器学习)<br />
r<br />
共34页<br />
s i<br />
14
d 为像素点s i的真实深度,则相对深度误差为:<br />
T<br />
R , s<br />
'<br />
'<br />
T T<br />
d ( d d)<br />
d d d 1<br />
R , s i<br />
( xi,<br />
s r<br />
) 1<br />
i : SP i i中第si个像素对应的射线 :SP i i对应平面参数<br />
i i<br />
i<br />
则图像SP特征向量与其对应的平面参数之间统计关系为:<br />
i, si<br />
T T<br />
f ( | X , v , R ; ) exp( | R ( x ) 1)<br />
1<br />
i<br />
i<br />
i<br />
i<br />
N<br />
<br />
s 1<br />
:SP i中第s i个像素估计深度的可信度(机器学习)<br />
i<br />
共34页<br />
i,<br />
s<br />
i<br />
i,<br />
s<br />
i<br />
i<br />
i,<br />
s<br />
i<br />
r<br />
15
共面关系<br />
基本思路:摄像机中心到SP i与SP j中心点的相对距<br />
离来实现共面性的约束。<br />
|)<br />
)<br />
(<br />
|<br />
exp(<br />
)<br />
,<br />
,<br />
,<br />
( '<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
,<br />
0<br />
,<br />
,<br />
, i<br />
i<br />
i<br />
i<br />
i<br />
s<br />
j<br />
T<br />
s<br />
i<br />
i<br />
T<br />
s<br />
i<br />
ij<br />
s<br />
i<br />
ij<br />
j<br />
i<br />
s<br />
d<br />
R<br />
R<br />
y<br />
R<br />
y<br />
h <br />
<br />
<br />
<br />
<br />
<br />
'<br />
'<br />
'<br />
'<br />
,<br />
,<br />
1<br />
i<br />
i<br />
s<br />
i<br />
i<br />
T<br />
s<br />
i<br />
d<br />
R <br />
<br />
'<br />
,<br />
,<br />
'<br />
'<br />
'<br />
'<br />
1<br />
i<br />
i<br />
s<br />
i<br />
j<br />
T<br />
s<br />
i<br />
d<br />
R <br />
<br />
其中<br />
'<br />
,<br />
,<br />
,<br />
0<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
i<br />
i<br />
i<br />
s<br />
i<br />
s<br />
i<br />
s<br />
d<br />
d<br />
d <br />
|)<br />
)<br />
(<br />
|<br />
exp(<br />
)<br />
,<br />
,<br />
,<br />
( '<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
,<br />
0<br />
,<br />
,<br />
, j<br />
j<br />
j<br />
j<br />
j<br />
s<br />
j<br />
T<br />
s<br />
j<br />
i<br />
T<br />
s<br />
j<br />
ij<br />
s<br />
j<br />
ij<br />
j<br />
i<br />
s<br />
d<br />
R<br />
R<br />
y<br />
R<br />
y<br />
h <br />
<br />
<br />
<br />
<br />
<br />
)<br />
(<br />
)<br />
(<br />
)<br />
( '<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
' ,<br />
<br />
<br />
<br />
<br />
j<br />
i<br />
j<br />
i<br />
s<br />
s<br />
s<br />
s<br />
h<br />
h<br />
h<br />
'<br />
'<br />
'<br />
'<br />
,<br />
,<br />
1<br />
j<br />
j<br />
s<br />
j<br />
j<br />
T<br />
s<br />
j<br />
d<br />
R <br />
<br />
'<br />
,<br />
,<br />
'<br />
'<br />
'<br />
'<br />
1<br />
j<br />
j<br />
s<br />
j<br />
i<br />
T<br />
s<br />
j<br />
d<br />
R <br />
<br />
'<br />
,<br />
,<br />
,<br />
0<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
j<br />
j<br />
i<br />
s<br />
j<br />
s<br />
j<br />
s<br />
d<br />
d<br />
d <br />
'<br />
,<br />
,<br />
,<br />
'<br />
,<br />
,<br />
0<br />
,<br />
,<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
'<br />
)<br />
(<br />
)<br />
(<br />
j<br />
j<br />
j<br />
j<br />
j<br />
j<br />
j<br />
s<br />
j<br />
s<br />
j<br />
s<br />
j<br />
s<br />
j<br />
s<br />
j<br />
T<br />
s<br />
j<br />
i<br />
T<br />
s<br />
j<br />
d<br />
d<br />
d<br />
d<br />
d<br />
R<br />
R <br />
<br />
<br />
<br />
1<br />
2<br />
d<br />
d <br />
16<br />
共34页
连接关系<br />
基本思路:选择摄像机中心到SP i与SP j边界上点相对<br />
距离来实现连接性的约束。<br />
h , s<br />
j<br />
T<br />
T<br />
( i , j , yij<br />
, Ri.<br />
R j ) exp( yij<br />
| ( Ri,<br />
s i<br />
R j,<br />
s ) d0<br />
si j<br />
i<br />
j<br />
T<br />
R i,<br />
s<br />
,<br />
T<br />
i i 1<br />
di<br />
s R i j,<br />
s j j 1<br />
d j,<br />
s j<br />
其中 i si<br />
j s j d d d 0 , , <br />
( <br />
T<br />
T<br />
R i,<br />
s i<br />
R j,<br />
s j ) d0<br />
( di,<br />
s d j,<br />
s ) di,<br />
s d j,<br />
s<br />
i<br />
j<br />
i<br />
j<br />
i<br />
共34页<br />
j<br />
|)<br />
17
共线关系<br />
基本思路:选择摄像机中心到SP i与SP j共线点的相对<br />
距离来实现共线性的约束。<br />
T<br />
T<br />
hs ( i , j , yij<br />
, Ri<br />
s ) exp( yij<br />
| ( Ri,<br />
s i<br />
Ri,<br />
s j ) d0,<br />
i<br />
其中<br />
T<br />
R i,<br />
s i<br />
1<br />
di,<br />
s<br />
j<br />
i<br />
T<br />
R j,<br />
s j 1 d j,<br />
s<br />
, i<br />
i<br />
i si<br />
T<br />
T<br />
hs ( i , j,<br />
yij<br />
, R j s ) exp( yij<br />
| ( R j,<br />
s i<br />
R j,<br />
s j ) d0,<br />
h<br />
j<br />
s , s<br />
i<br />
j<br />
( ) hs<br />
( )<br />
h ( )<br />
i s j<br />
, j<br />
j<br />
j s j<br />
i<br />
j<br />
R <br />
d<br />
T<br />
'<br />
i,<br />
s 1 i j i,<br />
si<br />
R <br />
d<br />
T<br />
'<br />
j,<br />
s 1 j i j,<br />
s j<br />
d <br />
d<br />
d<br />
0, si<br />
i,<br />
si<br />
'<br />
i,<br />
si<br />
d <br />
d<br />
d<br />
0, s j i,<br />
s j<br />
'<br />
i,<br />
s j<br />
T<br />
T<br />
'<br />
'<br />
( R j,<br />
s , ) 0,<br />
( , , )<br />
j i R j s j j d s d<br />
j j s d j j s d<br />
j j,<br />
s d j j,<br />
s j<br />
共34页<br />
|)<br />
|)<br />
18
遮挡关系<br />
基本思路:SP i与SP j对应空间平面的遮挡关系用SP i与SP j间的“边界特<br />
征向量”来确定,最终用变量y ij来标示,即:<br />
y ij=0:表示对应平面间为遮挡关系<br />
y ij=1:表示对应平面共面<br />
y ij通过逻辑回归分析与机器学习的方法获取。<br />
共34页<br />
19
*<br />
<br />
<br />
MAP-MRF模型的求解<br />
arg maxl<br />
ogP(<br />
| X , , y,<br />
R,<br />
)<br />
<br />
<br />
1<br />
arg max log f ( | X , v , R ; ) f ( , <br />
<br />
<br />
r<br />
<br />
1 i i i i<br />
Z i<br />
i,<br />
j<br />
K<br />
( <br />
M i<br />
arg min <br />
i s s i s i i s<br />
i 1 , i , i ,<br />
<br />
<br />
T<br />
| ( R ) d 1|<br />
i i<br />
T<br />
T<br />
yij<br />
| ( Ri<br />
s i<br />
R j,<br />
s j ) ds<br />
,<br />
jN( i)<br />
s , s B<br />
<br />
i<br />
j<br />
ij<br />
, i<br />
j<br />
i s j<br />
T<br />
T<br />
y | ( R R ) d<br />
jN( i)<br />
s C<br />
j<br />
j<br />
ij<br />
j,<br />
s j i j,<br />
s j j s j<br />
|<br />
|<br />
2<br />
i<br />
j<br />
|<br />
y<br />
i,<br />
j<br />
, R , R )<br />
其中,K为图像中所有SP数量,N(i)为Sp i的邻域SP集,B ij是Sp i与SP j边界<br />
点集(互连性),C j是SP j(共面性与共线性)中心。<br />
每一项皆为α的线性函数,最终的目标函数为:<br />
arg min Ax b Bx Cx<br />
x<br />
1<br />
共34页<br />
1<br />
1<br />
i<br />
<br />
i <br />
x <br />
<br />
<br />
<br />
<br />
<br />
K <br />
j<br />
20
参数学习<br />
已知真实深度(3D激光扫描器获取)与图像特征向量。<br />
1.遮挡关系参数 的估计 [1] yij<br />
eij<br />
:SP i、SP j之间边界特征向量<br />
:模型参数(机器学习)<br />
2.深度估计的可信度 的估计 [1]<br />
<br />
i, s<br />
<br />
T<br />
P( yij<br />
1<br />
| eij;<br />
) 1<br />
( 1<br />
exp( <br />
eij<br />
))<br />
i, s<br />
i<br />
T<br />
P( i s 1<br />
| xi,<br />
s ; )<br />
1<br />
( 1<br />
exp( <br />
xi,<br />
, i<br />
i<br />
si<br />
:SP i中第s i个像素估计深度的可信度<br />
i<br />
:模型参数(机器学习)<br />
[1]C.M. Bishop, Pattern Recognition and Machine Learning. Springer, 2006.<br />
共34页<br />
))<br />
21
3.特征向量与深度关系参数 r<br />
的估计<br />
<br />
arg max log P(<br />
X , , y,<br />
R,<br />
)<br />
*<br />
r<br />
<br />
arg max log f ( | X , , R ; ) log f ( , |<br />
<br />
1 i i i i r<br />
r<br />
i<br />
i,<br />
j<br />
第二项与 无关,上式可简化为:<br />
r<br />
<br />
r<br />
*<br />
M i 1 T<br />
r<br />
arg min<br />
<br />
<br />
i s i s xi<br />
s r<br />
i 1 , (<br />
i<br />
, 1)<br />
<br />
i<br />
r<br />
d<br />
最后采用Multi‐Conditional Learning [1] 方法求取。<br />
i,<br />
s<br />
i<br />
2<br />
i<br />
j<br />
y<br />
ij<br />
, R , R )<br />
[1]M.K. Chris Paul, X. Wang, and A. McCallum, “Multi‐Conditional Learning for Joint Probability Models with<br />
Latent Variables,” Proc.NIPS Workshop Advances Structured Learning Text and SpeechProcessing, 2006.<br />
共34页<br />
i<br />
j<br />
22
图像特征<br />
1.平滑、边缘及角点检测(3Χ3)模板全部作用于图像Y通道,另外,第<br />
一滤波模板单独作用于图像的Cb与Cr通道。<br />
2.用于方向检测(5Χ5)模板作用于图像的Y通道。<br />
Laws模板滤波(图像模式为YCbCr):<br />
设17个滤波器输出为 ,则<br />
)<br />
17<br />
,<br />
,<br />
1<br />
)(<br />
,<br />
( <br />
<br />
n<br />
y<br />
x<br />
F n<br />
<br />
<br />
i<br />
SP<br />
y<br />
x<br />
k<br />
n<br />
i<br />
y<br />
x<br />
F<br />
y<br />
x<br />
I<br />
n<br />
E<br />
)<br />
,<br />
(<br />
)<br />
,<br />
(<br />
*<br />
)<br />
,<br />
(<br />
)<br />
(<br />
令K=2、4,则分别求出能量值及峰态值,共生成34维特征向量。<br />
23<br />
共34页
为了充分利用上下文信息,对指定SP,从三个尺度上对其进行特征<br />
提取,并将每个尺度中其四邻域的SP特征也作为其特征的一部分:<br />
加入14个SP形状(如SP边数、像素密度等)、位置(如水平与垂直<br />
方向平均坐标等)及离心率特征 [1] 。<br />
最终特征向量维数:34*(4+1)*3+14=524<br />
[1][ICCV2005]D. Hoiem, A. Efros, and M. Herbert, “Geometric Context from a Single<br />
Image,” Proc. 10th Int’l Conf. Computer Vision, 2005.<br />
共34页<br />
24
边界特征向量(用于SP对应空间平面之间遮挡关系的判断):<br />
分别根据图像纹理、颜色、边缘等7个不同的属性,从两个尺度上对图像<br />
进行分割,共生成14个分割,对应14维特征向量,每个分量为任意两个<br />
SP是否属于同一分割区域的标记。<br />
如果SP i、SP j在14个分割中都属于同一个分割区域,则SP i、SP j对应的空<br />
间平面更可能为共面或互连关系,否则,则可能为遮挡关系。<br />
共34页<br />
25
实验结果<br />
数据:534幅分辨率为2272X1704图片(包含3D激光扫描器获取深度图),<br />
用400幅用于训练学习,134用于测试,另外用588幅分辨率为800X600<br />
普通图片进行测试,总体结果如下:<br />
共34页<br />
26
共34页<br />
27
融入目标信息优化重建结果<br />
基本思路:如果能获取空间场景中某些目标的信息 [1][2] (如位置、大小、<br />
方向等),则可有效地对三维结构进行优化。<br />
[1]N. Dalai and B. Triggs, “Histogram of Oriented Gradients for Human Detection,” Proc. IEEE CS Conf.<br />
Computer Vision and Pattern Recognition, 2005.<br />
[2]D. Hoiem, A. Efros, and M. Hebert, “Putting Objects in Perspective,” Proc. IEEE CS Conf. Computer Vision<br />
and Pattern Recognition, 2006.<br />
共34页<br />
28
大场景重建<br />
基本思路:设采用常规SFM方法求取深度 d ,从单幅图片中估计出的深<br />
度为 d ,在MRF模型中增加 T与<br />
的约束项 。<br />
d d ( ) f<br />
i<br />
n n n n n n<br />
P ( | X , Y,<br />
dT<br />
; ) f1(<br />
| X , , R , Q ; )<br />
n<br />
f<br />
n<br />
n<br />
n n n n<br />
f 2( | y , R , Q )<br />
n n n n n<br />
f 3( | dT<br />
, yT<br />
, R , Q )<br />
其中,Q为摄像机的姿态(3X4矩阵), yT<br />
为特征点匹配的可信度。<br />
3<br />
最终仍是线性优化问题。<br />
i<br />
n<br />
K<br />
<br />
i1<br />
T<br />
( | d , y , R,<br />
Q)<br />
exp( y<br />
| d R 1|)<br />
T<br />
T<br />
共34页<br />
T<br />
Ti<br />
3 <br />
Ti<br />
i<br />
i<br />
29
共34页<br />
二维图像<br />
重建结果<br />
30
几点思考<br />
1.每个Superpixel的特征向量维数比较高(524维),如果进行降维处理<br />
(如KL变换),是否能对学习、预测的速度与精度有所提高?<br />
2.用14维Superpixels间的边缘特征向量来判断对应空间平面遮挡情况<br />
存在,可信度?<br />
3.三维重建的精度?<br />
4.大场景重建与SFM方法相结合,但SFM方法所占比重比较大,如果SFM<br />
方法失败(如特征点检测或匹配错误),会对重建结果造成多大影响?<br />
共34页<br />
31
3.总结与展望<br />
共34页<br />
32
总结与展望<br />
1.总结<br />
三维重建的难点不在于三维重建的过程,更在于对二维图像的理解。通<br />
过从原始图像中提取与理解尽量多的语义信息,或由用户提供适量的语<br />
义信息,近而将语义信息用于对三维重建过程的指导或对三维重建结果<br />
的优化的思路是可行。<br />
2.展望<br />
通过对图像低层语义的理解,在常规<br />
SFM重建方法的基础上,对整体重建速<br />
度和精度进行优化(遮挡、弱纹理区域<br />
重建得到的点云过于稀疏等问题)。<br />
通过对用户交互式提供的高层语义的<br />
理解,指导重建过程以达到较高的重<br />
建效果。<br />
共34页<br />
33
欢迎批评指正,谢谢!<br />
共34页<br />
34