智能手機(jī)上的3D傳感器是這一時(shí)期的開端,想要更深入的開啟攝影拍照的新時(shí)期,還需要不斷的摸索研究。未來,在推進(jìn)機(jī)器學(xué)習(xí)技術(shù)方面,會(huì)有另一個(gè)重要的階段。我們有可能會(huì)放棄使用3D傳感器,而僅僅使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來推斷物體在空間中的坐標(biāo),這將節(jié)省在手機(jī)中安裝傳感器的費(fèi)用。然而,就像微軟的研究人員和學(xué)術(shù)合作者在本周發(fā)表的一份報(bào)告中所討論的那樣,目前這種只使用軟件的方法收效甚微。他們寫道,只使用軟件的方法被稱為“絕對(duì)姿態(tài)回歸”(absolute pose regression),在經(jīng)過訓(xùn)練后它并未能推而廣之,這意味著無論卷積神經(jīng)網(wǎng)絡(luò)掌握了什么技術(shù),在用新圖像進(jìn)行測(cè)試時(shí),它都無法準(zhǔn)確估量幾何圖形。
換句話說,它將利用所有的這些活動(dòng)來持續(xù)進(jìn)行學(xué)習(xí),總有一天,只要有足夠的3D圖像,卷積神經(jīng)網(wǎng)絡(luò)或任何其它被使用的算法都能足夠聰明地觀察這個(gè)世界,即使沒有3D傳感器幫助提供深度感知能力,也能準(zhǔn)確地知道這個(gè)世界是什么樣的。
人們做了大量的統(tǒng)計(jì)工作來實(shí)現(xiàn)移軸鏡頭那樣的物理特性,不管是有特殊攝像裝置的,還是沒有特殊攝像裝置的。例如,一項(xiàng)名為“隨機(jī)抽樣一致性”(RANSAC)的技術(shù)可以追溯到1981年,專門用于尋找三維世界中的地標(biāo),這些地標(biāo)可以映射到二維圖像平面上的點(diǎn),以便了解二維圖像與三維現(xiàn)實(shí)世界之間的關(guān)系。使用這種技術(shù),可以更好地理解二維呈現(xiàn)是如何與現(xiàn)實(shí)世界相對(duì)應(yīng)的。
2015年,佛羅倫薩大學(xué)的一組研究人員在RANSAC技術(shù)的基礎(chǔ)上,通過對(duì)相機(jī)拍攝的照片進(jìn)行逆向推理,推導(dǎo)出了一種泛傾斜變焦相機(jī)的結(jié)構(gòu),他們能夠通過軟件來分析相機(jī)位置的不同在多大程度上引發(fā)了失真,從而有效地將控制相機(jī)的執(zhí)行機(jī)構(gòu)調(diào)至佳狀態(tài),他們可以將這種技術(shù)用于視頻,而不僅僅是用于靜止的圖像。
2017年,德國(guó)埃爾蘭根-紐倫堡大學(xué)和伍茲霍爾海洋學(xué)研究所的研究人員展示了一個(gè)名為CameraTransform的Python庫,該庫可讓人們通過對(duì)拍攝的圖像進(jìn)行逆向計(jì)算,來估算物體在現(xiàn)實(shí)世界中的真實(shí)尺寸。
去年,德國(guó)慕尼黑工業(yè)大學(xué)和佳能公司的研究人員表示,只需拍一張圖片就可以推斷出被另一個(gè)物體遮擋的場(chǎng)景中有什么。這種技術(shù)被稱為“分層深度圖像”,可以通過從照片中移除一個(gè)物體來創(chuàng)建新的場(chǎng)景,呈現(xiàn)相機(jī)從未見過的背景,但這是通過圖像計(jì)算實(shí)現(xiàn)的。該方法使用了許多神經(jīng)網(wǎng)絡(luò)應(yīng)用中常見的編碼-解碼器方法來估計(jì)場(chǎng)景的深度,也使用了“生成對(duì)抗網(wǎng)絡(luò)”(GAN)來構(gòu)造場(chǎng)景中在拍攝照片時(shí)從未實(shí)際出現(xiàn)在視野里的部分。
所有的這些研究正在不斷涌現(xiàn),并將在下一代配備3D傳感器的智能手機(jī)攝像頭上達(dá)到高潮,帶來一些不可思議的功能特性。這種研究應(yīng)該會(huì)帶來令人驚嘆的成果。至少,人們可以想象,用智能手機(jī)拍攝出的人像不再會(huì)出現(xiàn)怪異的面部扭曲。超分辨率的建筑圖片將有可能通過消除鏡頭上的所有扭曲而形成平行線。隨著手機(jī)變得能夠大量產(chǎn)生精確度和逼真度皆十分驚人的照片,智能手機(jī)行業(yè)將能夠在與單反相機(jī)的交鋒中取得又一場(chǎng)勝利。
但是,智能手機(jī)攝影的長(zhǎng)期趨勢(shì)當(dāng)然是遠(yuǎn)離現(xiàn)實(shí)主義,而轉(zhuǎn)向取得更引人注目的效果。這在計(jì)算攝影誕生之前是無法想象的。因此,我們可能會(huì)看到3D傳感技術(shù)的應(yīng)用趨向于超現(xiàn)實(shí)主義。舉例來說,移軸相機(jī)可以用來創(chuàng)造一些出奇漂亮的效果,比如縮小景深到一個(gè)極端的程度,這會(huì)使得風(fēng)景看起來就像玩具模型,但效果還是出奇的好,有些手機(jī)應(yīng)用程序也能做到類似的事情,但將3D傳感器與人工智能技術(shù)結(jié)合起來的效果,將遠(yuǎn)遠(yuǎn)超出那些應(yīng)用程序所能達(dá)到的效果,Photoshop中有實(shí)現(xiàn)移軸的技術(shù),但是每次按下快門按鈕,相機(jī)都會(huì)產(chǎn)生同樣的效果,毫無疑問會(huì)讓人更加心滿意足。
(AM 8:00-12:00 PM 14:00-18:00)