光學(xué)(3D)三維視覺成像技術(shù)原理
三維視覺成像作為當(dāng)前工業(yè)視覺信息感知的核心技術(shù),隨著工業(yè)4.0時代的臨近,3D視覺成像在制造業(yè)的熱度也愈加高漲,下面我們將通過三種常見的三種光學(xué)三維視覺成像技術(shù)為大家做一個簡單的介紹!
飛行時間法(通過光線的時間差恢復(fù)深度)
飛行時間(Time of Flight,ToF)3D成像是一種通過給測量光脈沖從發(fā)射到接收所需的時間差來獲取深度信息的技術(shù),目標連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行(往返)時間來得到目標物距離的一種成像技術(shù)。根據(jù)測距方式的不同,還可以分為直接測量飛行時間(D-ToF)和間接測量飛行時間(I-ToF)。
直接測量飛行時間(D-ToF)通過向被測物體發(fā)射和接收N次光信號,然后對接收到的光信號的飛行時間進行直接統(tǒng)計,其中出現(xiàn)頻率最高的飛行時間被用來計算被測物體的景深。DTOF測量的是發(fā)射脈沖和接收脈沖之間的時間間隔。
計算公式為:測量距離=(光子傳播時間/2)*光的速度
間接測量飛行時間(I-ToF),全稱indirect Time of Flight,即iTof是通過測量相位偏移來間接測量光的飛行時間,而非直接測量飛行時間。大多數(shù)ITOF間接測量方案使用測量相位偏移的方法,即發(fā)射正弦波/方波和接收正弦波/方波之間的相位差。
相位到距離深度計算公式為:
C:光的速度。
fm:設(shè)制頻率。
在測量精度上,dTof的測量精度不會隨著測量距離的增大而降低,iTof的測量精度會受到測量距離的影響。在功耗上,由于dTof采用脈沖波,能夠達到超低占空比,所以功耗低。而iTof隨著測量距離的增大,需要提高光照功率或者延長曝光時間來獲取更高的精度,因此所需的功耗也會大幅增加。整體而言,TOF成像的特點是檢測速度快、視場大、工作距離遠,價格相對便宜,但精度不盡如人意,易受環(huán)境光線的影響。
結(jié)構(gòu)光法(散斑投射)
結(jié)構(gòu)光法是目前運用最廣泛的一種視覺成像技術(shù),也是目前是機器人3D視覺感知的主要方式,適用于各種表面紋理的物體,測量精度較高。
結(jié)構(gòu)光成像系統(tǒng)是由若干個投影儀和相機組成,常用的結(jié)構(gòu)形式有:單投影儀-單相機、單投影儀-雙相機、單投影儀-多相機、單相機-雙投影儀和單相機-多投影儀等典型結(jié)構(gòu)形式。常用的投影儀主要有下列幾種類型:液晶投影(LCD)、數(shù)字光調(diào)制投影(DLP,如數(shù)字微鏡器件(DMD)、激光LED圖案直接投影。
原理:投影儀向目標物體投射特定的結(jié)構(gòu)光照明圖案,由相機攝取被目標調(diào)制后的圖像,再通過圖像處理和視覺模型求出目標物體的三維信息。根據(jù)結(jié)構(gòu)光投影次數(shù),可以分成單次投影3D和多次投影3D方法。
單次投影結(jié)構(gòu)光主要采用空間復(fù)用編碼和頻率復(fù)用編碼形式實現(xiàn),常用的編碼形式有:彩色編碼、灰度索引、幾何形狀編碼和隨機斑點。目前在機器人手眼系統(tǒng)應(yīng)用中,對于三維測量精度要求不高的場合,如碼垛、拆垛、三維抓取等,比較受歡迎的是投射偽隨機斑點獲得目標三維信息。
多次投影3D方法主要采用時間復(fù)用編碼方式實現(xiàn),常用的圖案編碼形式有:二進制編碼、多頻相移編碼τ35和混合編碼法(如格雷碼十相移條紋)等。
條紋投影3D成像基本原理是利用計算機生成結(jié)構(gòu)光圖案或用特殊的光學(xué)裝置產(chǎn)生結(jié)構(gòu)光,經(jīng)過光學(xué)投影系統(tǒng)投射至被測物體表面,然后采用圖像獲取設(shè)備(如CCD或CMOS相機)采集被物體表面調(diào)制后發(fā)生變形的結(jié)構(gòu)光圖像,利用圖像處理算法計算圖像中每個像素點與物體輪廓上點的對應(yīng)關(guān)系;最后通過系統(tǒng)結(jié)構(gòu)模型及其標定技術(shù),計算得到被測物體的三維輪廓信息。
在實際應(yīng)用中,常采用格雷碼投影、正弦相移條紋投影或格雷碼十正弦相移混合投影3D技術(shù)。
立體視覺成像
立體視覺成像是用一只眼睛或兩只眼睛感知三維結(jié)構(gòu),通過從不同視點獲取兩幅或多幅圖像,然后根據(jù)圖像中的差異進行模型重建,從而得到目標物體的三維結(jié)構(gòu)或深度信息。根據(jù)重建所需圖像數(shù)量的不同,立體視覺法主要分為單幅圖像法、基于雙目視覺法以及多目立體視覺法。
單目視覺成像
單目視覺深度感知線索通常有:透視、焦距差異、多視覺成像、覆蓋、陰影、運動視差等。在機器人視覺里還可以用鏡像1,以及其他 shape from X10等方法實現(xiàn)。
雙目視覺成像
雙目視覺深度感知視覺線索有:眼睛的收斂位置和雙目視差。在機器視覺里利用兩個相機從兩個視點對同一個目標場景獲取兩個視點圖像再計算兩個視點圖像中同名點的視差獲得目標場景的3D深度信息。
典型的雙目立體視覺計算過程包含下面四個步驟:圖像畸變矯正、立體圖像對校正、圖像配準和三角法重投影視差圖計算。
多(目)視覺成像
也稱多視點立體成像,用單個或多個相機從多個視點獲取同一個目標場景的多幅圖像,重構(gòu)目標場景的三維信息。其基本原理如下圖所示。
多視點立體成像主要用于下列幾種場景:
1)使用多個相機從不同視點,獲取同一個目標
場景多幅圖像,然后基于特征的立體重構(gòu)等算法求取場景深度和空間結(jié)構(gòu)信息
2)從運動恢復(fù)形狀(SM)的技術(shù)。使用同一相機在其內(nèi)參數(shù)不變的條件下,從不同視點獲取多幅圖像,重構(gòu)目標場景的三維信息。該技術(shù)常用于跟蹤目標場景中大量的控制點,連續(xù)恢復(fù)場景的3D結(jié)構(gòu)信息、相機的姿態(tài)和位置。
立體視覺成像最大的特點就是不需要額外的光源,傳統(tǒng)的自然光就可以滿足需求,應(yīng)用廣泛且抗干擾性強。但由于需要在多個相機之間建立點對點的對應(yīng)關(guān)系,步驟相對繁瑣,對于表面紋理不豐富的目標可能不夠準確。
素材僅供學(xué)習(xí)--參考來源:機器人網(wǎng)、知乎大大通--