(相關(guān)資料圖)
SLAM 全稱是 Simultaneous Localization and Mapping(同時定位與地圖構(gòu)建),是機器人和計算機視覺領(lǐng)域的關(guān)鍵技術(shù),可以在未知環(huán)境中確定自身方位并同時構(gòu)建環(huán)境三維地圖,有著非常廣泛的應(yīng)用場景,比如說增強現(xiàn)實、虛擬現(xiàn)實等。
經(jīng)過幾十年的發(fā)展,視覺 SLAM 在理論上已經(jīng)比較成熟,但是在實際產(chǎn)品應(yīng)用中,往往會面臨兩方面的挑戰(zhàn)。
一是關(guān)于精度和穩(wěn)定性。實際場景中,難免會存在動態(tài)變化,而且很多區(qū)域沒有足夠的紋理,或有相似的重復(fù)紋理。這些都會導(dǎo)致匹配比較困難,從而導(dǎo)致優(yōu)化計算不穩(wěn)定。
二是實時性,在一些非常大尺度的場景下,甚至是城市級的場景下,SLAM的計算復(fù)雜度會非常高。要在一個低功耗的移動設(shè)備上做到實時計算,這個難度非常大的。
提升穩(wěn)定性的主要思路是如何讓目標(biāo)函數(shù)優(yōu)化變得穩(wěn)定。SLAM 計算其實就是一個目標(biāo)函數(shù)的優(yōu)化問題,因此優(yōu)化方程的正確性和充分性就顯得非常重要。
傳統(tǒng)的定位導(dǎo)航方案是GPS,而且只適合于室外,精度通常只有10米級別。
室內(nèi)一般較常采用的方案有WiFi、藍牙,通常定位精度也基本上只能到米級, 而且要預(yù)先去布置設(shè)備,工程量比較大、成本比較高。
相比而言,基于視覺的方案定位,精度可以達到分米甚至厘米級別,而且不需要額外布置設(shè)備,成本相對比較低。
基于視覺的定位與AR導(dǎo)航,主要分為三大模塊,分別是稀疏地圖重建、稠密地圖重建和視覺定位與跟蹤。
關(guān)鍵詞: