Only Perception: 顯示器運算？ MIT 研究者將顯示器變成攝影機

2009-12-23

顯示器運算？ MIT 研究者將顯示器變成攝影機

Computing with a wave of the hand (w/ Video)
http://www.physorg.com/news179760349.html

By Larry Hardesty, December 11, 2009

(PhysOrg.com) -- iPhone 眾所周知的觸控螢幕顯示使用電容式感應（capacitive sensing），在此鄰近的手指會擾亂螢幕中感應器之間的電氣連結。有種運算方式，那使用嵌入式光學感應器來追蹤使用者手指的運動，現在才正要上市。不過 MIT 媒體實驗室（Media Lab）的研究者已想出如何使用這樣的感應器將顯示器轉變成巨大的無透鏡攝影機（lensless cameras）。在 12/19 的 Siggraph Asia 上 -- 最近出現的 Siggraph（首要圖學研究研討會）分支 -- MIT 團隊為其研究的首個應用進行簡報：一款讓使用者利用手勢（hand gestures）操縱螢幕上影像的顯示器。

有許多研究者已在研究這樣的姿勢界面（gestural interfaces，手勢界面），舉例來說，只要指向視窗然後移動手指，就能讓電腦使用者將螢幕上的視窗到處拖曳，或著甩甩手腕（flick of the wrist）就能在三度空間中旋轉虛擬物體。某些大型姿勢界面已商業化，例如媒體實驗室的 Hiroshi Ishii 所開發的那些，這些研究都是 Tom Cruise（阿湯哥）的角色在電影《關鍵報告／Minority Report》中所用系統的基礎。

不過 "這些通常涉及塞滿房間的昂貴攝影機或你穿戴在手指上的追蹤標記，" Matthew Hirsch 表示，媒體實驗室的博士候選人，他與媒體實驗室教授 Ramesh Raskar 以及 Henry Holtzman 還有訪問研究者 Douglas Lanman 開發出這款新顯示器。某些實驗性系統 -- 例如微軟的 Natal -- 並非使用嵌入在顯示器中的小型攝影機，來捕捉姿勢資訊。但因為這些攝影機偏離螢幕中央，所以在短距離內並不好用，而且它們無法提供一種從姿勢到觸控螢幕互動的無縫轉變（transition）。在螢幕後方距離夠遠的攝影機能提供那樣的轉變，如他們在微軟 SecondLight 當中所作的，但那會增加顯示器的厚度，而且需要昂貴的硬體在螢幕上交替呈現透明與不透明的狀態（譯註：螢幕透明時才能捕捉姿勢）。"此研究目標是能夠將姿勢顯示器合併到薄薄的 LCD 裝置中 " -- 例如手機 -- "而且要能夠在不穿戴手套或任何類似東西的情況下辦到，" Hirsch 說。

這套媒體實驗室系統需要一個液晶陣列，如同一般 LCD 當中那種，其正後方後有個光學感應陣列。這些液晶成為... 就某種意義來說... 透鏡，顯示黑與白的圖案（pattern），讓光線通過到達感應器。不過這些圖案交替如此迅速，以致於不管這 LCD 在顯示什麼 -- 例如智慧手機上的應用清單或著電玩中的虛擬世界 -- 觀看者都不會注意到它。

Lanman 說，要解釋這套系統如何運作，最簡單的方法是想像一下：放在感應器前面的東西，不是 LCD，而是一個滿是針孔的陣列。通過每個針孔的光線，將會照在一小塊感應器上，產生低解析度的影像。因為每個針孔影像得自稍微不同的位置，這些影像兜在一起就能產生「是什麼東西橫在螢幕前面」的大量深度資訊。只要在某個液晶陣列中顯示某種圖案，它就能模擬出一片針孔，譬如在中央像素裡有 19 x 19 個像素是白的（透明），而其他是黑的。

Lanman 解釋，針孔的問題在於，它們只允許非常少量的光線抵達感應器，其所需曝光時間過長，以致於不實用。所以 LCD 顯示出來的是一種圖案，其中每個 19 x 19 的區塊被細分成大小不同的黑與白矩形規則圖案。因為黑色與白色方塊的數量一樣，所以這些區塊通過更多光線。

然而，這個 19 x 19 的區塊全都相互毗鄰，所以傳給感應器的影像是一種令人困惑的混亂重疊。不過這些黑白方塊的圖案讓系統能夠計算影像的距離，捕捉像針孔陣列那樣的深度資訊，但捕捉速度比它更快。

內建光學感應器的 LCD 太新了，所以媒體實驗室的研究者弄不到，不過他們在實驗室中製作出一個顯示器的實物模型來測試他們的方法。如同某些現存的觸控螢幕系統，此實物模型使用一部離螢幕一定距離的攝影機來記錄通過一批方塊的影像。但那提供了一種方式，測定控制該系統的那這些演算法在真實世界的設置中是否有效。在實驗室的實驗中，研究者證明，他們能利用手勢來操縱螢幕上的物體，並無縫地在姿勢控制與普通的觸控螢幕互動間轉移。

在目前的實驗性姿勢界面中，"我喜歡這款，因為它真的整合至顯示器中，" Paul Debevec 說，南加大創新技術研究所圖學實驗室主任，其博士論文導致電影《駭客任務／The Matrix》當中的創新視覺效果。"無論如何每個人都需要一款顯示器。而且那比理解指尖在何處或是某種動作捕捉狀況棒多了。那真的是一個人的手在顯示器之前的全三維影像。"

事實上，研究者已在探索利用這套新系統將顯示器變成高解析度攝影機的可能性。並非捕捉低解析度的三維影像，相反的，不同的黑白圖案能在一特定焦距深度上捕捉二維影像。因為影像解析度將與嵌入螢幕中的感應器數量成比例，所以能捕捉到的影像會比傳統的 webcam 來得好。

Raskar，他指導媒體實驗室的 Camera Culture Group，強調這項研究的影響甚至比「單單將顯示器轉變成攝影機」更加深遠。他說，在運算的歷史中，「智慧從大型主機移向桌上到行動裝置，而現在則是移向螢幕」。想法是「每個像素都有部電腦在背後」，他說，為人類與電腦如何互動提供一個重新想像的機會。

"那是 Ramesh 很多研究的正字標記，" Debevec 說。"他以穿腸破肚的方式以及某種起先讓你疑惑的、不同技術的奇怪排列，提出瘋狂攝影機。「嗯，為什麼你要這麼做？」沒人會完全以他那種方式做事，因為沒人會以他那種方式思考。當你開始了解它時，你領悟到，這裡實際上有個非常有趣的新東西正在發生。"

※ 示範影片詳見原站。

＊ MIT BiDi Screen
http://web.media.mit.edu/~mhirsch/bidi/

＊新 3D 感應器將上市關鍵報告不再是夢想
＊超越 WIMP 界面 -- OpenInterface project
＊可觸碰的全像圖（全息圖）

＊次世代透鏡允諾更多控制
＊非線性透鏡使影像更清晰、視野不狹隘
＊微波訊號：讓「看不見的」能被看見
＊利用智慧手機進行超音波成像
＊手機使用無透鏡成像（LUCAS）進行健康監測
＊光之聲：創新技術破除光學顯微術的障礙

＊二套「視網膜影像顯示」裝置原型出爐
＊三維奈米成像
＊ Qualcomm 的電子書將使用 mirasol display

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)