21.08.2013 Views

基于语义理解的三维重建

基于语义理解的三维重建

基于语义理解的三维重建

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>基于语义理解的三维重建</strong><br />

WangWei<br />

2012年2月28日<br />

共34页<br />

1


内容提要<br />

1.语义理解在三维重建中的作用<br />

2.Learning 3-D Scene Structure from a Single Still Image<br />

3.总结与展望<br />

共34页<br />

2


1.语义理解在三维重建中的作用<br />

共34页<br />

3


三维重建存在的问题<br />

存在问题:(基于特征点匹配的自下向上重建方法)<br />

遮挡问题导致相应部分点云重建失败。<br />

在缺乏纹理的区域,只能获得稀疏的点云,甚至不能获得点云。<br />

重复性纹理导致重建错误。<br />

基线过大导致重建错误。<br />

需要大量图片<br />

......<br />

解决思路:通过深层理解图像或点云中所包含的语义信息,或者由用<br />

户提供语义信息,指导三维重建过程或对三维重建结果进行优化。<br />

共34页<br />

4


语义层次模型 [1]<br />

视觉特征语义:也称低层语义,如图像的颜色、形状、纹理等低<br />

级视觉特征,与视觉感知直接相连。<br />

目标语义和空间关系语义:如房前有一棵树、桌上有个箱子等,<br />

需要识别和提取图像中的目标类别、目标之间的空间位置等关系,<br />

涉及到模式识别和逻辑推理的相关技术。<br />

高层语义:包括场景语义(如海滨、街道、室内等)、行为语义(如<br />

表演、超越、进攻等)和情感语义(如平静、和谐、振奋等)。<br />

[1]Deselaers T, Keeysers D, Ney H, Classification Error Rate for Quantitative Evaluation of Conten‐based<br />

Image Retrieval Systems, In Proc. Of International Conference on Pattern Recognition ( ICPR 2004), 2004, Vol.<br />

2, pp. 505‐508.<br />

共34页<br />

5


三维重建中的语义来源<br />

1.二维图像:图像中的目标所属类<br />

别、目标的几何特征、目标间的<br />

空间关系、图像整体空间结构等。<br />

目标相对大小<br />

遮挡关系<br />

纹理梯度<br />

亮度和阴影<br />

空气透视<br />

......<br />

共34页<br />

6


2.三维点云:点云中的目标(如直<br />

线、平面、曲面等)及目标间空间<br />

几何关系。<br />

点云拓朴结构<br />

3.用户交互:用户交互式输入的高<br />

层知识(如目标类别、目标间的空<br />

间关系、目标属性等)。<br />

共34页<br />

7


部分文献<br />

[cvpr2011]Semantic structure from motion<br />

[ICCV2011]Semantic Structure From Motion with Object and Point<br />

Interactions<br />

[ICCV2011]Classification and reconstruction of surfaces from point clouds<br />

of man‐made objects<br />

[SIGGRAPH2011]Context‐Based Search for 3D Models<br />

[SIGGRAPH2011]Characterizing Structural Relationships in Scenes Using<br />

Graph Kernels<br />

[CVPR2010]Growing semantically meaningful models for visual SLAM<br />

[SIGGRAPH2010]L., Sharf, A., Zhang, H., Cohen‐Or, D., Chen, B. 2010,<br />

SmartBoxes for Interactive Urban Reconstruction<br />

[ICCV09]Decomposing a Scene into Geometric and Semantically<br />

Consistent regions<br />

共34页<br />

8


2. Learning 3D scene structure from<br />

a single still image<br />

共34页<br />

9


1.将图片分割 [1] 成多个Superpixels,假定空间场景由<br />

许多很小的Planes组成,Superpixels与Planes相互<br />

对应。<br />

2.求取每个Superpixel特征向量及“边缘特征向<br />

量”(纹理、颜色等)。<br />

3.MRF模型化Planes参数之间、Superpixels特征向量<br />

与Planes参数之间的关系。<br />

基本思路<br />

4.采用监督学习的方式求取相关参数。<br />

5.求解MRF模型,并根据Planes参数进行场景重建。<br />

6.为提高重建精度,融入对象检测与识别方法。<br />

7.大场景重建时与常规SFM算法相结合。<br />

Superpixels<br />

3‐d Mesh<br />

[1][ICCV2004]P. Felzenszwalb and D. Huttenlocher, “Efficient Graph‐Based Image Segmentation,” Int’l J. Computer<br />

Vision, vol. 59, 2004. 共34页<br />

10


空间平面参数α 特征:<br />

1.对空间平面上任意点q,满足 <br />

2. 为摄像机中心到空间平面距离<br />

1<br />

<br />

3.任意射线R i(单位向量),空间点i的深度<br />

最终目标:argmax(P(α | x; θ))<br />

α:空间平面参数;<br />

x :Superpixel特征向量集<br />

θ:模型参数(机器学习)<br />

空间平面参数化<br />

T<br />

q<br />

1<br />

共34页<br />

d 1<br />

i<br />

R<br />

T<br />

i<br />

<br />

i<br />

11


MAP-MRF模型简述<br />

<br />

<br />

F<br />

f<br />

df<br />

d<br />

f<br />

P<br />

f<br />

f<br />

C<br />

f<br />

R )<br />

|<br />

(<br />

)<br />

,<br />

(<br />

)<br />

(<br />

*<br />

*<br />

贝叶斯风险:<br />

<br />

<br />

<br />

1<br />

0<br />

)<br />

,<br />

(<br />

*<br />

f<br />

f<br />

C<br />

<br />

<br />

f<br />

f<br />

if<br />

*<br />

otherwise<br />

)<br />

|<br />

(<br />

1<br />

)<br />

|<br />

(<br />

1<br />

)<br />

|<br />

( *<br />

*<br />

:<br />

:<br />

d<br />

f<br />

kP<br />

df<br />

d<br />

f<br />

P<br />

df<br />

d<br />

f<br />

P<br />

f<br />

f<br />

f<br />

f<br />

f<br />

f<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

)}<br />

(<br />

)<br />

|<br />

(<br />

{<br />

max<br />

arg<br />

)<br />

|<br />

(<br />

max<br />

arg<br />

)<br />

(<br />

min<br />

arg<br />

*<br />

*<br />

f<br />

P<br />

f<br />

d<br />

P<br />

d<br />

f<br />

P<br />

f<br />

R<br />

f<br />

F<br />

f<br />

F<br />

f<br />

F<br />

f <br />

<br />

<br />

<br />

<br />

<br />

(风险函数<br />

MAP估计:<br />

)<br />

1.MAP(最大后险概率)<br />

2.MAP‐MRF<br />

任意随机场为MRF随机场的充要条件:<br />

)<br />

(<br />

1<br />

1<br />

)<br />

(<br />

f<br />

U<br />

T<br />

e<br />

Z<br />

f<br />

P<br />

<br />

<br />

<br />

<br />

<br />

<br />

S<br />

i S<br />

i N<br />

i<br />

i<br />

i<br />

i<br />

i<br />

f<br />

f<br />

V<br />

f<br />

V<br />

f<br />

U<br />

'<br />

'<br />

2<br />

1<br />

)<br />

,<br />

(<br />

)<br />

(<br />

)<br />

(<br />

能量函数:<br />

12<br />

共34页


PLANE PARAMETER MRF模型(MAP-MRF)<br />

1<br />

P(<br />

X , , y,<br />

R,<br />

) f1<br />

( i<br />

| X i,<br />

vi,<br />

Ri;<br />

) f2<br />

( i<br />

, j |<br />

Z<br />

i<br />

i,<br />

j<br />

y<br />

i,<br />

j<br />

, R , R )<br />

f ( ) :表征Superpixel(以下简称SPi)特征向量与空间平面参数之间的统计相关性。 1 <br />

f ( ) :表征SP对应空间平面参数彼此之间的统计相关性。具体由SP之间的互连性、<br />

2 <br />

共面性、共线性、遮挡关系等几部分共同决定,而这些关系的决定通过衡量<br />

在相邻SP中所选择的不同像素点之间的关系来实现。即:<br />

s<br />

si j<br />

f<br />

2<br />

( )<br />

<br />

hsi<br />

, s<br />

{ s , s } N<br />

i<br />

j<br />

j<br />

( )<br />

其中, 、 为选择的像素,h为像素间的关系。<br />

i :SPi对应的空间平面参数 X i :SPi特征向量,即 524 x IR : s 1,<br />

S<br />

X i,<br />

s<br />

i<br />

i i ,<br />

R i :摄像机中心到SPi所包含的像素点射线集合,即 i :Spi估计深度的置信度 y i,<br />

j<br />

:SP i、SP j对应空间平面之间是否为遮挡关系的标记<br />

共34页<br />

R : s 1,<br />

S<br />

R i,<br />

s i<br />

i i ,<br />

i<br />

j<br />

13


特征与深度关系<br />

基本思路:图像某区域特征(纹理、颜色、边缘等)在一定程度上与该<br />

区域相应的空间平面的深度、方向等信息相关。<br />

设 ' 为SPi中像素si对应的估计深度, d<br />

其与si的特征向量之间存在如下关系: T<br />

x i,<br />

k<br />

'<br />

d x <br />

T<br />

, s<br />

i i<br />

:SP i中第s i个像素的特征向量<br />

r :模型参数(机器学习)<br />

r<br />

共34页<br />

s i<br />

14


d 为像素点s i的真实深度,则相对深度误差为:<br />

T<br />

R , s<br />

'<br />

'<br />

T T<br />

d ( d d)<br />

d d d 1<br />

R , s i<br />

( xi,<br />

s r<br />

) 1<br />

i : SP i i中第si个像素对应的射线 :SP i i对应平面参数<br />

i i<br />

i<br />

则图像SP特征向量与其对应的平面参数之间统计关系为:<br />

i, si<br />

T T<br />

f ( | X , v , R ; ) exp( | R ( x ) 1)<br />

1<br />

i<br />

i<br />

i<br />

i<br />

N<br />

<br />

s 1<br />

:SP i中第s i个像素估计深度的可信度(机器学习)<br />

i<br />

共34页<br />

i,<br />

s<br />

i<br />

i,<br />

s<br />

i<br />

i<br />

i,<br />

s<br />

i<br />

r<br />

15


共面关系<br />

基本思路:摄像机中心到SP i与SP j中心点的相对距<br />

离来实现共面性的约束。<br />

|)<br />

)<br />

(<br />

|<br />

exp(<br />

)<br />

,<br />

,<br />

,<br />

( '<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

,<br />

0<br />

,<br />

,<br />

, i<br />

i<br />

i<br />

i<br />

i<br />

s<br />

j<br />

T<br />

s<br />

i<br />

i<br />

T<br />

s<br />

i<br />

ij<br />

s<br />

i<br />

ij<br />

j<br />

i<br />

s<br />

d<br />

R<br />

R<br />

y<br />

R<br />

y<br />

h <br />

<br />

<br />

<br />

<br />

<br />

'<br />

'<br />

'<br />

'<br />

,<br />

,<br />

1<br />

i<br />

i<br />

s<br />

i<br />

i<br />

T<br />

s<br />

i<br />

d<br />

R <br />

<br />

'<br />

,<br />

,<br />

'<br />

'<br />

'<br />

'<br />

1<br />

i<br />

i<br />

s<br />

i<br />

j<br />

T<br />

s<br />

i<br />

d<br />

R <br />

<br />

其中<br />

'<br />

,<br />

,<br />

,<br />

0<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

i<br />

i<br />

i<br />

s<br />

i<br />

s<br />

i<br />

s<br />

d<br />

d<br />

d <br />

|)<br />

)<br />

(<br />

|<br />

exp(<br />

)<br />

,<br />

,<br />

,<br />

( '<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

,<br />

0<br />

,<br />

,<br />

, j<br />

j<br />

j<br />

j<br />

j<br />

s<br />

j<br />

T<br />

s<br />

j<br />

i<br />

T<br />

s<br />

j<br />

ij<br />

s<br />

j<br />

ij<br />

j<br />

i<br />

s<br />

d<br />

R<br />

R<br />

y<br />

R<br />

y<br />

h <br />

<br />

<br />

<br />

<br />

<br />

)<br />

(<br />

)<br />

(<br />

)<br />

( '<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

' ,<br />

<br />

<br />

<br />

<br />

j<br />

i<br />

j<br />

i<br />

s<br />

s<br />

s<br />

s<br />

h<br />

h<br />

h<br />

'<br />

'<br />

'<br />

'<br />

,<br />

,<br />

1<br />

j<br />

j<br />

s<br />

j<br />

j<br />

T<br />

s<br />

j<br />

d<br />

R <br />

<br />

'<br />

,<br />

,<br />

'<br />

'<br />

'<br />

'<br />

1<br />

j<br />

j<br />

s<br />

j<br />

i<br />

T<br />

s<br />

j<br />

d<br />

R <br />

<br />

'<br />

,<br />

,<br />

,<br />

0<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

j<br />

j<br />

i<br />

s<br />

j<br />

s<br />

j<br />

s<br />

d<br />

d<br />

d <br />

'<br />

,<br />

,<br />

,<br />

'<br />

,<br />

,<br />

0<br />

,<br />

,<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

'<br />

)<br />

(<br />

)<br />

(<br />

j<br />

j<br />

j<br />

j<br />

j<br />

j<br />

j<br />

s<br />

j<br />

s<br />

j<br />

s<br />

j<br />

s<br />

j<br />

s<br />

j<br />

T<br />

s<br />

j<br />

i<br />

T<br />

s<br />

j<br />

d<br />

d<br />

d<br />

d<br />

d<br />

R<br />

R <br />

<br />

<br />

<br />

1<br />

2<br />

d<br />

d <br />

16<br />

共34页


连接关系<br />

基本思路:选择摄像机中心到SP i与SP j边界上点相对<br />

距离来实现连接性的约束。<br />

h , s<br />

j<br />

T<br />

T<br />

( i , j , yij<br />

, Ri.<br />

R j ) exp( yij<br />

| ( Ri,<br />

s i<br />

R j,<br />

s ) d0<br />

si j<br />

i<br />

j<br />

T<br />

R i,<br />

s<br />

,<br />

T<br />

i i 1<br />

di<br />

s R i j,<br />

s j j 1<br />

d j,<br />

s j<br />

其中 i si<br />

j s j d d d 0 , , <br />

( <br />

T<br />

T<br />

R i,<br />

s i<br />

R j,<br />

s j ) d0<br />

( di,<br />

s d j,<br />

s ) di,<br />

s d j,<br />

s<br />

i<br />

j<br />

i<br />

j<br />

i<br />

共34页<br />

j<br />

|)<br />

17


共线关系<br />

基本思路:选择摄像机中心到SP i与SP j共线点的相对<br />

距离来实现共线性的约束。<br />

T<br />

T<br />

hs ( i , j , yij<br />

, Ri<br />

s ) exp( yij<br />

| ( Ri,<br />

s i<br />

Ri,<br />

s j ) d0,<br />

i<br />

其中<br />

T<br />

R i,<br />

s i<br />

1<br />

di,<br />

s<br />

j<br />

i<br />

T<br />

R j,<br />

s j 1 d j,<br />

s<br />

, i<br />

i<br />

i si<br />

T<br />

T<br />

hs ( i , j,<br />

yij<br />

, R j s ) exp( yij<br />

| ( R j,<br />

s i<br />

R j,<br />

s j ) d0,<br />

h<br />

j<br />

s , s<br />

i<br />

j<br />

( ) hs<br />

( )<br />

h ( )<br />

i s j<br />

, j<br />

j<br />

j s j<br />

i<br />

j<br />

R <br />

d<br />

T<br />

'<br />

i,<br />

s 1 i j i,<br />

si<br />

R <br />

d<br />

T<br />

'<br />

j,<br />

s 1 j i j,<br />

s j<br />

d <br />

d<br />

d<br />

0, si<br />

i,<br />

si<br />

'<br />

i,<br />

si<br />

d <br />

d<br />

d<br />

0, s j i,<br />

s j<br />

'<br />

i,<br />

s j<br />

T<br />

T<br />

'<br />

'<br />

( R j,<br />

s , ) 0,<br />

( , , )<br />

j i R j s j j d s d<br />

j j s d j j s d<br />

j j,<br />

s d j j,<br />

s j<br />

共34页<br />

|)<br />

|)<br />

18


遮挡关系<br />

基本思路:SP i与SP j对应空间平面的遮挡关系用SP i与SP j间的“边界特<br />

征向量”来确定,最终用变量y ij来标示,即:<br />

y ij=0:表示对应平面间为遮挡关系<br />

y ij=1:表示对应平面共面<br />

y ij通过逻辑回归分析与机器学习的方法获取。<br />

共34页<br />

19


*<br />

<br />

<br />

MAP-MRF模型的求解<br />

arg maxl<br />

ogP(<br />

| X , , y,<br />

R,<br />

)<br />

<br />

<br />

1<br />

arg max log f ( | X , v , R ; ) f ( , <br />

<br />

<br />

r<br />

<br />

1 i i i i<br />

Z i<br />

i,<br />

j<br />

K<br />

( <br />

M i<br />

arg min <br />

i s s i s i i s<br />

i 1 , i , i ,<br />

<br />

<br />

T<br />

| ( R ) d 1|<br />

i i<br />

T<br />

T<br />

yij<br />

| ( Ri<br />

s i<br />

R j,<br />

s j ) ds<br />

,<br />

jN( i)<br />

s , s B<br />

<br />

i<br />

j<br />

ij<br />

, i<br />

j<br />

i s j<br />

T<br />

T<br />

y | ( R R ) d<br />

jN( i)<br />

s C<br />

j<br />

j<br />

ij<br />

j,<br />

s j i j,<br />

s j j s j<br />

|<br />

|<br />

2<br />

i<br />

j<br />

|<br />

y<br />

i,<br />

j<br />

, R , R )<br />

其中,K为图像中所有SP数量,N(i)为Sp i的邻域SP集,B ij是Sp i与SP j边界<br />

点集(互连性),C j是SP j(共面性与共线性)中心。<br />

每一项皆为α的线性函数,最终的目标函数为:<br />

arg min Ax b Bx Cx<br />

x<br />

1<br />

共34页<br />

1<br />

1<br />

i<br />

<br />

i <br />

x <br />

<br />

<br />

<br />

<br />

<br />

K <br />

j<br />

20


参数学习<br />

已知真实深度(3D激光扫描器获取)与图像特征向量。<br />

1.遮挡关系参数 的估计 [1] yij<br />

eij<br />

:SP i、SP j之间边界特征向量<br />

:模型参数(机器学习)<br />

2.深度估计的可信度 的估计 [1]<br />

<br />

i, s<br />

<br />

T<br />

P( yij<br />

1<br />

| eij;<br />

) 1<br />

( 1<br />

exp( <br />

eij<br />

))<br />

i, s<br />

i<br />

T<br />

P( i s 1<br />

| xi,<br />

s ; )<br />

1<br />

( 1<br />

exp( <br />

xi,<br />

, i<br />

i<br />

si<br />

:SP i中第s i个像素估计深度的可信度<br />

i<br />

:模型参数(机器学习)<br />

[1]C.M. Bishop, Pattern Recognition and Machine Learning. Springer, 2006.<br />

共34页<br />

))<br />

21


3.特征向量与深度关系参数 r<br />

的估计<br />

<br />

arg max log P(<br />

X , , y,<br />

R,<br />

)<br />

*<br />

r<br />

<br />

arg max log f ( | X , , R ; ) log f ( , |<br />

<br />

1 i i i i r<br />

r<br />

i<br />

i,<br />

j<br />

第二项与 无关,上式可简化为:<br />

r<br />

<br />

r<br />

*<br />

M i 1 T<br />

r<br />

arg min<br />

<br />

<br />

i s i s xi<br />

s r<br />

i 1 , (<br />

i<br />

, 1)<br />

<br />

i<br />

r<br />

d<br />

最后采用Multi‐Conditional Learning [1] 方法求取。<br />

i,<br />

s<br />

i<br />

2<br />

i<br />

j<br />

y<br />

ij<br />

, R , R )<br />

[1]M.K. Chris Paul, X. Wang, and A. McCallum, “Multi‐Conditional Learning for Joint Probability Models with<br />

Latent Variables,” Proc.NIPS Workshop Advances Structured Learning Text and SpeechProcessing, 2006.<br />

共34页<br />

i<br />

j<br />

22


图像特征<br />

1.平滑、边缘及角点检测(3Χ3)模板全部作用于图像Y通道,另外,第<br />

一滤波模板单独作用于图像的Cb与Cr通道。<br />

2.用于方向检测(5Χ5)模板作用于图像的Y通道。<br />

Laws模板滤波(图像模式为YCbCr):<br />

设17个滤波器输出为 ,则<br />

)<br />

17<br />

,<br />

,<br />

1<br />

)(<br />

,<br />

( <br />

<br />

n<br />

y<br />

x<br />

F n<br />

<br />

<br />

i<br />

SP<br />

y<br />

x<br />

k<br />

n<br />

i<br />

y<br />

x<br />

F<br />

y<br />

x<br />

I<br />

n<br />

E<br />

)<br />

,<br />

(<br />

)<br />

,<br />

(<br />

*<br />

)<br />

,<br />

(<br />

)<br />

(<br />

令K=2、4,则分别求出能量值及峰态值,共生成34维特征向量。<br />

23<br />

共34页


为了充分利用上下文信息,对指定SP,从三个尺度上对其进行特征<br />

提取,并将每个尺度中其四邻域的SP特征也作为其特征的一部分:<br />

加入14个SP形状(如SP边数、像素密度等)、位置(如水平与垂直<br />

方向平均坐标等)及离心率特征 [1] 。<br />

最终特征向量维数:34*(4+1)*3+14=524<br />

[1][ICCV2005]D. Hoiem, A. Efros, and M. Herbert, “Geometric Context from a Single<br />

Image,” Proc. 10th Int’l Conf. Computer Vision, 2005.<br />

共34页<br />

24


边界特征向量(用于SP对应空间平面之间遮挡关系的判断):<br />

分别根据图像纹理、颜色、边缘等7个不同的属性,从两个尺度上对图像<br />

进行分割,共生成14个分割,对应14维特征向量,每个分量为任意两个<br />

SP是否属于同一分割区域的标记。<br />

如果SP i、SP j在14个分割中都属于同一个分割区域,则SP i、SP j对应的空<br />

间平面更可能为共面或互连关系,否则,则可能为遮挡关系。<br />

共34页<br />

25


实验结果<br />

数据:534幅分辨率为2272X1704图片(包含3D激光扫描器获取深度图),<br />

用400幅用于训练学习,134用于测试,另外用588幅分辨率为800X600<br />

普通图片进行测试,总体结果如下:<br />

共34页<br />

26


共34页<br />

27


融入目标信息优化重建结果<br />

基本思路:如果能获取空间场景中某些目标的信息 [1][2] (如位置、大小、<br />

方向等),则可有效地对三维结构进行优化。<br />

[1]N. Dalai and B. Triggs, “Histogram of Oriented Gradients for Human Detection,” Proc. IEEE CS Conf.<br />

Computer Vision and Pattern Recognition, 2005.<br />

[2]D. Hoiem, A. Efros, and M. Hebert, “Putting Objects in Perspective,” Proc. IEEE CS Conf. Computer Vision<br />

and Pattern Recognition, 2006.<br />

共34页<br />

28


大场景重建<br />

基本思路:设采用常规SFM方法求取深度 d ,从单幅图片中估计出的深<br />

度为 d ,在MRF模型中增加 T与<br />

的约束项 。<br />

d d ( ) f<br />

i<br />

n n n n n n<br />

P ( | X , Y,<br />

dT<br />

; ) f1(<br />

| X , , R , Q ; )<br />

n<br />

f<br />

n<br />

n<br />

n n n n<br />

f 2( | y , R , Q )<br />

n n n n n<br />

f 3( | dT<br />

, yT<br />

, R , Q )<br />

其中,Q为摄像机的姿态(3X4矩阵), yT<br />

为特征点匹配的可信度。<br />

3<br />

最终仍是线性优化问题。<br />

i<br />

n<br />

K<br />

<br />

i1<br />

T<br />

( | d , y , R,<br />

Q)<br />

exp( y<br />

| d R 1|)<br />

T<br />

T<br />

共34页<br />

T<br />

Ti<br />

3 <br />

Ti<br />

i<br />

i<br />

29


共34页<br />

二维图像<br />

重建结果<br />

30


几点思考<br />

1.每个Superpixel的特征向量维数比较高(524维),如果进行降维处理<br />

(如KL变换),是否能对学习、预测的速度与精度有所提高?<br />

2.用14维Superpixels间的边缘特征向量来判断对应空间平面遮挡情况<br />

存在,可信度?<br />

3.三维重建的精度?<br />

4.大场景重建与SFM方法相结合,但SFM方法所占比重比较大,如果SFM<br />

方法失败(如特征点检测或匹配错误),会对重建结果造成多大影响?<br />

共34页<br />

31


3.总结与展望<br />

共34页<br />

32


总结与展望<br />

1.总结<br />

三维重建的难点不在于三维重建的过程,更在于对二维图像的理解。通<br />

过从原始图像中提取与理解尽量多的语义信息,或由用户提供适量的语<br />

义信息,近而将语义信息用于对三维重建过程的指导或对三维重建结果<br />

的优化的思路是可行。<br />

2.展望<br />

通过对图像低层语义的理解,在常规<br />

SFM重建方法的基础上,对整体重建速<br />

度和精度进行优化(遮挡、弱纹理区域<br />

重建得到的点云过于稀疏等问题)。<br />

通过对用户交互式提供的高层语义的<br />

理解,指导重建过程以达到较高的重<br />

建效果。<br />

共34页<br />

33


欢迎批评指正,谢谢!<br />

共34页<br />

34

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!