首页 理论教育 机器追踪人脑进展:认知+思维+实践,BIM大爆炸

机器追踪人脑进展:认知+思维+实践,BIM大爆炸

时间:2023-08-21 理论教育 版权反馈
【摘要】:这个用机器模拟大脑的工作一直在不停进步,不同的学科领域对进步阶段有不同的划分。大脑的这项功能,叫作运动视觉。你可能还记得小时候家里使用的胶卷相机,而很多年轻人从小接触的就是数码相机了。数码相机带来的最大好处就是成本大幅度降低,可处理照片数量的急剧提升。

机器追踪人脑进展:认知+思维+实践,BIM大爆炸

当然,大脑在还原三维世界的时候,并没有套用这个公式,至少,人们感受不到大脑进行了计算,只是自然而然地“看到”了三维物体。

算法是人们根据数学知识和光学知识反推出来的,所以倾斜摄影也被叫作“逆向建模”。有了基本的数学算法,人们就开始想办法来模拟双眼和大脑,来逆向还原三维世界。

这个用机器模拟大脑的工作一直在不停进步,不同的学科领域对进步阶段有不同的划分。在测量学里,利用照片进行逆向建模称为“摄影测量学”,它的发展分为三个阶段:模拟摄影测量、解析摄影测量和数字摄影测量。

一战之后,人们开始希望通过倾斜摄影来进行三维地形的重建。那时候计算机还没有被发明,照片也是需要冲印的,没有数字格式。在无法进行大量计算的时候,人们采用的办法最为直接:既然双眼成像能建立模型,那我就直接照着双眼的原理造出一台机器来。维也纳军事地理研究所率先制成了一台“自动立体测图仪”,后来由德国卡尔蔡司厂进一步发展,把这种制图仪量产化。

别看这个大家伙样子挺唬人的,其实它的原理特别简单暴力,就是事先按照两只眼睛的距离同时拍摄两张照片,然后用幻灯机的方式把照片投影到桌面上,用金属杆子模拟光线的传输路径,一个一个逆向寻找交点的位置,然后在桌面上按比例还原地形模型。

因为没有计算条件,这种方式干脆就不进行计算,操作笨重的机器,用杆子代表光线,在桌子上模拟出测量点的空间位置。你可以想象一下,要建立一个三维模型,要模拟多少个点。这个阶段,摄影测量必须是经过专业培训的人才能进行,而且要耗费非常大的人力。这种纯模拟的方式,就被命名为模拟摄影测量时代。

到了20世纪50年代,第一台计算机问世,人们终于可以借助机器进行大量的计算,摄影测量也准备迈入下一个时代:解析摄影测量时代。也许你会想,求解三维空间坐标,不就是上面那个978-7-111-60410-5-Chapter05-39.jpg的公式吗?用得着惊动计算机吗?

要说清楚这个问题,还得说说人脑的另一项逆天的功能。

人脑通过双眼的视差,可以区分物体的远近,这种情况下,距离越近的物体,双眼产生的视差越大,相反,距离越远的物体,这种视差效应就越小。当两个物体都距离比较远的时候,就很难通过视差效应来区分它们的远近了。回忆一下,你看远处山的时候,是不是很难分辨哪座山离你更远?

不过没关系,人是会动的动物,只要随便移动一小段距离,或者转一个角度,视野的改变量就远远大于双眼的距离了。而大脑可以短暂地记住运动之前看到的画面,和运动之后的画面做比较,就能顺利地重建更复杂的三维模型了。这个过程相当于是通过移动得到两张画面,把原来的视差效应放大了。

另外,通过双眼视差基本上只能看到物体的同一面,判断出某一个点的远近;而通过移动,就能看到物体的另一侧,通过旋转一定的视角在大脑中建立更全面的模型。

大脑的这项功能,叫作运动视觉。对于大型场景的三维重建时,前面讲的双目测距原理已经不够用了,进入解析摄影测量时代后,人们用计算机来模拟运动视觉,简单来说,就是不再用两台相对位置固定的相机来模拟两只眼睛了,而是通过不断改变相机的位置,拍摄物体不同角度的照片,来重建三维模型。这个工作又叫作运动恢复结构(Structure From Motion)。

为什么运动恢复结构会带来大量的计算量呢?

在双目测距法中,两张照片是在一个平面里的,相对距离也始终保持不变。而运动恢复结构中,两张照片不在一个平面里,空间位置和角度都发生了变化,而且每次拍摄,这些变量改变多少都是不确定的。相当于两张照片完全不在一个坐标系里,它们分别有自己的三个方向的位置坐标,以及三个方向的角度坐标。人们最终要得到某个点的坐标信息不在任何一张照片自己的坐标系里而是要通过复杂的坐标变换得到它在真实世界里的坐标。(www.xing528.com)

这些多出来的未知坐标数据,叫作照片的外方位元素。加上本来就要求解的某点空间坐标,未知数变得非常多。对这些未知数求解的方法很多,公式一个比一个复杂,我们就不写了,总之你需要知道,因为未知数增多,单个方程不够用了,要列方程组,所以要在每组照片上找出很多个对应点,列出线性方程同时求解。

这些庞大的计算量,靠人力几乎是不可能完成的,必须依靠计算机。对于这些照片信息知道得越少,求解所需要的方程数量就越多,计算误差也就越大;相反,想要减少方程的数量和误差,就要尽可能多地提前把这些信息告诉计算机,比如在地面上设置控制点,预先定义拍摄相机的坐标,而这本身也会带来误差。

至此,摄影测量的发展出现了两个分支:一是通过发展硬件设备更精确地提前得知拍照时的相机方位和角度二是通过发展软件算法更精确快速地求解相机的方位和角度比如空中三角测量法。

1957年,美国人海拉瓦首先发表了解析测图仪原理的论文,真实的解析测图仪在20世纪60年代出现,70年代中期开始在市场上广泛应用。这标志着摄影测量正式进入解析摄影测量时代

这个时期的技术有三个特点:一是处理的还是冲洗的照片,除了需要进行上述计算,还要对照片本身在曝光、冲洗和老化过程中的变形进行修正计算;二是虽然使用了计算机,但还只是利用它进行公式本身的计算,基本没有专门的软件被开发出来,仍需要大量的人工操作,主要的工作就是靠人眼挑选出两张照片中哪些点是相同的关键点,再输入计算机进行计算。

这个时代并没有持续很久,随着数字技术和软件技术的快速发展,人们很快进入了数字摄影测量时代。

有两项关键技术标志着时代的跨越。

一是数码摄影技术的诞生。

你可能还记得小时候家里使用的胶卷相机,而很多年轻人从小接触的就是数码相机了。数码相机带来的最大好处就是成本大幅度降低,可处理照片数量的急剧提升。这一点普通人都能感受到,以前家里存着几本相册,有几百张照片就很不错了,而现在每个人的计算机里都存着成千上万张照片。

对大型三维场景的还原,需要的照片数量动辄就是上万张,如果一张张冲洗,对照片的形变进行矫正,再一张张人工比对,工作量大得可怕。数码照片直接存储在计算机里,可以更快速地进行处理和分类,这无疑把数据处理效率提升了一个大台阶

二是专业处理软件的诞生。

前面为了方便理解,我们一直说的是一组照片上一两个点的位置比对。而实际上为了建立一个完整的模型,每组照片上需要处理的点都至少要几百个。在数字摄影测量时代之前,这项关键点匹配的工作都是靠人工来完成的。

而计算机的快速发展,让人们能够开发出具备特定算法的软件,在两张图片中快速精准地找到大量匹配点,这又进一步提高了效率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈