2008-03-04

新演算法從 2D 照片重建 3D 景致

From 2-D pictures to 3 dimensions
http://www.physorg.com/news123763523.html

March 03, 2008

你的大峽谷、時代廣場或其他目標的照片或許拍的很棒,難道以 3D 來炫耀它們不會更棒嗎?

由 UCSD 電腦科學家團隊所設計的一種獲獎 3D 重建演算法,在現實可掌握的範圍內,帶來這種夢想。

研究者掌握住「自動調校(autocalibration)」的核心,這是電腦視覺中,一種研究完善、基礎的問題。自動調校旨在僅利用其影像(自內部設定與空間定向未知的相機取得),就能重新獲得某場景的三維結構。

自動調校是較大 3D 影像重建挑戰的一部份,那已經引起 Google、微軟與其他人的注意。

Manmohan Chandraker,UCSD 電腦科學與工程系的五年級博士生,領導此研究。他、Sameer Agarwal,UCSD 電腦科學校友,以及他們各自的博士指導者 David Kriegman 與 Serge Belongie,在 International Conference on Computer Vision(ICCV,2007 年 10 月在巴西里約熱內盧舉行)上對其研究進行簡報。ICCV 是電腦視覺領域中的首要研討會。因為這項研究,Chandraker 得到 ICCV 有名的 David Marr 獎的提名。

這項技術能運用到各式各樣的應用中。例如,某人在線上銷售鞋子,就能為鞋子拍攝照片,然後為其存貨進行 3D 重建。這樣的重建將提供比影像或影片還要更多關於鞋子實際上看起來是怎樣的資訊。

此演算法亦可用於自動化校準賭場、機場保全攝影機的網路。與現有的可浸入式媒體耦合,這種演算法可用來創造出擴增實境(augmented-reality,AR,詳見:http://sa.ylib.com/read/readshow.asp?FDocNo=67&DocNo=110)的城市、超級市場或其他有趣地點的漫遊。

在 ICCV 論文中,UCSD 電腦科學家提出第一個在實際上可縮放的演算法以進行 3D 重建,那提供「一種理論上最佳化的憑證」。換言之,此技術從所能得到的資料輸入中,計算出最佳的 3D 重建,而且不會因為大量照片而大幅減緩速度。

"我們的演算法必定能提供最佳的 3D 重建," Chandraker 說。"它是一個相當實用的演算法。事實上,這篇論文的重要性在於我們用以設計一個理論上正確演算法的方法,那在實際應用上亦運作良好。我們的方法利用現代凸面體最佳化(convex optimization)技巧進行全面性將分支與邊界框架中所涉及的成本函數(cost functions)最小化," Chandraker 解釋。

這篇論文,標題是「Globally Optimal Affine and Metric Upgrades in Stratified Autocalibration」可在下列網址取得: http://vision.ucsd.edu/kriegman-grp/papers/iccv07a.pdf 用在實作上的 MATLAB 原型碼將在它準備妥當後上線。

※ 相關報導:

利用百萬張相片還原場景
史丹佛科學家將 2D 影像變成 3D 模型
3D 突破:可更新之全像式顯示器
360 度的浸入式影片 讓你身歷其境
新技術讓組織變成透明!
仿生之眼:具有電路的隱形眼鏡帶來超級視力?
視覺研究:為何人們在群眾中不會引人注目?
研究:背景如何支配我們信什麼就看見什麼
人工智慧在 2029 年可與人類較量?

光的黑暗面 -- 碎形的光渦流

沒有留言: