当然,大脑在还原三维世界的时候,并没有套用这个公式,至少,人们感受不到大脑进行了计算,只是自然而然地“看到”了三维物体。
算法是人们根据数学知识和光学知识反推出来的,所以倾斜摄影也被叫作“逆向建模”。有了基本的数学算法,人们就开始想办法来模拟双眼和大脑,来逆向还原三维世界。
这个用机器模拟大脑的工作一直在不停进步,不同的学科领域对进步阶段有不同的划分。在测量学里,利用照片进行逆向建模称为“摄影测量学”,它的发展分为三个阶段:模拟摄影测量、解析摄影测量和数字摄影测量。
一战之后,人们开始希望通过倾斜摄影来进行三维地形的重建。那时候计算机还没有被发明,照片也是需要冲印的,没有数字格式。在无法进行大量计算的时候,人们采用的办法最为直接:既然双眼成像能建立模型,那我就直接照着双眼的原理造出一台机器来。维也纳军事地理研究所率先制成了一台“自动立体测图仪”,后来由德国卡尔蔡司厂进一步发展,把这种制图仪量产化。
别看这个大家伙样子挺唬人的,其实它的原理特别简单暴力,就是事先按照两只眼睛的距离同时拍摄两张照片,然后用幻灯机的方式把照片投影到桌面上,用金属杆子模拟光线的传输路径,一个一个逆向寻找交点的位置,然后在桌面上按比例还原地形模型。
因为没有计算条件,这种方式干脆就不进行计算,操作笨重的机器,用杆子代表光线,在桌子上模拟出测量点的空间位置。你可以想象一下,要建立一个三维模型,要模拟多少个点。这个阶段,摄影测量必须是经过专业培训的人才能进行,而且要耗费非常大的人力。这种纯模拟的方式,就被命名为模拟摄影测量时代。
到了20世纪50年代,第一台计算机问世,人们终于可以借助机器进行大量的计算,摄影测量也准备迈入下一个时代:解析摄影测量时代。也许你会想,求解三维空间坐标,不就是上面那个的公式吗?用得着惊动计算机吗?
要说清楚这个问题,还得说说人脑的另一项逆天的功能。
人脑通过双眼的视差,可以区分物体的远近,这种情况下,距离越近的物体,双眼产生的视差越大,相反,距离越远的物体,这种视差效应就越小。当两个物体都距离比较远的时候,就很难通过视差效应来区分它们的远近了。回忆一下,你看远处山的时候,是不是很难分辨哪座山离你更远?
不过没关系,人是会动的动物,只要随便移动一小段距离,或者转一个角度,视野的改变量就远远大于双眼的距离了。而大脑可以短暂地记住运动之前看到的画面,和运动之后的画面做比较,就能顺利地重建更复杂的三维模型了。这个过程相当于是通过移动得到两张画面,把原来的视差效应放大了。
另外,通过双眼视差基本上只能看到物体的同一面,判断出某一个点的远近;而通过移动,就能看到物体的另一侧,通过旋转一定的视角在大脑中建立更全面的模型。
大脑的这项功能,叫作运动视觉。对于大型场景的三维重建时,前面讲的双目测距原理已经不够用了,进入解析摄影测量时代后,人们用计算机来模拟运动视觉,简单来说,就是不再用两台相对位置固定的相机来模拟两只眼睛了,而是通过不断改变相机的位置,拍摄物体不同角度的照片,来重建三维模型。这个工作又叫作运动恢复结构(Structure From Motion)。
为什么运动恢复结构会带来大量的计算量呢?
在双目测距法中,两张照片是在一个平面里的,相对距离也始终保持不变。而运动恢复结构中,两张照片不在一个平面里,空间位置和角度都发生了变化,而且每次拍摄,这些变量改变多少都是不确定的。相当于两张照片完全不在一个坐标系里,它们分别有自己的三个方向的位置坐标,以及三个方向的角度坐标。人们最终要得到某个点的坐标信息,不在任何一张照片自己的坐标系里,而是要通过复杂的坐标变换,得到它在真实世界里的坐标。(www.xing528.com)
这些多出来的未知坐标数据,叫作照片的外方位元素。加上本来就要求解的某点空间坐标,未知数变得非常多。对这些未知数求解的方法很多,公式一个比一个复杂,我们就不写了,总之你需要知道,因为未知数增多,单个方程不够用了,要列方程组,所以要在每组照片上找出很多个对应点,列出线性方程同时求解。
这些庞大的计算量,靠人力几乎是不可能完成的,必须依靠计算机。对于这些照片信息知道得越少,求解所需要的方程数量就越多,计算误差也就越大;相反,想要减少方程的数量和误差,就要尽可能多地提前把这些信息告诉计算机,比如在地面上设置控制点,预先定义拍摄相机的坐标,而这本身也会带来误差。
至此,摄影测量的发展出现了两个分支:一是通过发展硬件设备,更精确地提前得知拍照时的相机方位和角度;二是通过发展软件算法,更精确快速地求解相机的方位和角度,比如空中三角测量法。
1957年,美国人海拉瓦首先发表了解析测图仪原理的论文,真实的解析测图仪在20世纪60年代出现,70年代中期开始在市场上广泛应用。这标志着摄影测量正式进入解析摄影测量时代。
这个时期的技术有三个特点:一是处理的还是冲洗的照片,除了需要进行上述计算,还要对照片本身在曝光、冲洗和老化过程中的变形进行修正计算;二是虽然使用了计算机,但还只是利用它进行公式本身的计算,基本没有专门的软件被开发出来,仍需要大量的人工操作,主要的工作就是靠人眼挑选出两张照片中哪些点是相同的关键点,再输入计算机进行计算。
这个时代并没有持续很久,随着数字技术和软件技术的快速发展,人们很快进入了数字摄影测量时代。
有两项关键技术标志着时代的跨越。
一是数码摄影技术的诞生。
你可能还记得小时候家里使用的胶卷相机,而很多年轻人从小接触的就是数码相机了。数码相机带来的最大好处就是成本大幅度降低,可处理照片数量的急剧提升。这一点普通人都能感受到,以前家里存着几本相册,有几百张照片就很不错了,而现在每个人的计算机里都存着成千上万张照片。
对大型三维场景的还原,需要的照片数量动辄就是上万张,如果一张张冲洗,对照片的形变进行矫正,再一张张人工比对,工作量大得可怕。数码照片直接存储在计算机里,可以更快速地进行处理和分类,这无疑把数据处理的效率提升了一个大台阶。
二是专业处理软件的诞生。
前面为了方便理解,我们一直说的是一组照片上一两个点的位置比对。而实际上为了建立一个完整的模型,每组照片上需要处理的点都至少要几百个。在数字摄影测量时代之前,这项关键点匹配的工作都是靠人工来完成的。
而计算机的快速发展,让人们能够开发出具备特定算法的软件,在两张图片中快速精准地找到大量匹配点,这又进一步提高了效率。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。