2008-09-21

電腦理解這些字有何意義(?)

Computers figuring out what words mean
http://www.physorg.com/news140929129.html

September 18, 2008

法新社 -- 隨著一套語義圖(semantic map)的釋出,那教導電腦單字背後的意義,網際網路在本週變得更聰明了 -- 且賦予機器遠大於一位典型美國大學畢業生所擁有的用字範圍(vocabulary)。

Cognition Technologies 於週二開始將這套語義圖授權給有志讓程式基於時態與句子的上下文來「了解」單字的軟體創造者 -- 與人類腦袋所做的事十分雷同。

"我們教導電腦英語中幾乎所有單字與片語的意義," Cognition 的 CEO Scott Jarus 表示。

"這無疑是 Web 3.0,或著所謂語義網(Semantic Web)的基石。那花了 30 年;那是件把吃苦當吃補的事(a labor of love)," Jarus 說。

這套語義圖據報導是世上最大的一套,而且賦予電腦的字彙比一位典型美國大學畢業生的要大上 10 倍。

即將到來的第三代線上生活,預料會以直覺式人工智慧應用為特色,那迅速地穿過寬頻網際網路連接來作業。

當應用到網際網路搜尋時,語義技術所傳送的結果是人們所要尋找的,而非像過去那樣僅將單字與線上內容相配。

例如,「melancholy songs with birds(包括鳥兒在內的憂鬱歌曲)」的語義線上搜尋,將知道要把歌詞中的悲傷與各種不同的鳥類連在一起。

Cognition 的語義圖已用在 LexisNexis Concordance 的「e-discovery」軟體中,以過濾在審理的證據階段期間所累積的文件。

"我們幫助他們在大海中撈針," Jarus 說。

"過去時常是一箱又一箱的紙,而現在那有 80% 都是數位的。律師們能在被發現的資料(discovery material)中尋找確鑿的證據(smoking gun)。"

根據該公司表示,Cognition 的 Caselaw(法律案件)程式為了一項判例,使用該技術來挖掘超過半世紀的美國聯邦法院判決。

語義圖亦用於被廣泛使用的醫學資料庫。

Cognition 說,它亦能賦予全球熱門線上百科 Wikipedia「語義」的能力。

Web 3.0 的目標是要開發人工智慧「代理人」,那能為它們所服務的人,從網際網路幾座山一般的資訊中挖掘符合其感興趣的資料。

"那將會是種軟體應用,不斷地尋找你可能會感興趣的東西,同時正確地理解「你正在尋找的東西是什麼」的概念," Jarus 說。

他把它形容成 "人工智慧代理人是以推播(push,主動)為基礎而非以拉播(pull,被動)為基礎來為你工作。"

Cognition 有少數競爭者,每家公司都採取它們自己的方式來接近語義技術。

在七月,美國軟體巨人微軟買下位於舊金山的 Powerset,一家創立才三年的新興公司,專攻「詮釋」人們搜尋網際網路的「意圖」而非配對人們所使用的特定單字。

微軟表示,它計畫利用 Powerset 技術來強化其免費的 Live Search 服務,在賺錢的網際網路搜尋相關廣告競技場中,它已陷入排在 Google 與 Yahoo 之後的老三困境。

Powerset 的語義搜尋,在一個軟體平台中將語言學與工程學合併,基於查詢或片語來理解人們正在找什麼。

標準的搜尋引擎在搜尋詢問中回應個別的單字。

微軟搜尋、入口網站與廣告資深副總 Satya Nadella 那時候表示,三分之一的今日線上搜尋,並沒有在第一次嘗試中就給人們在尋找中的答案。

"今日的搜尋引擎不了解「灌木(shrub)」與「樹」是相似的概念," Nadella 在一篇 blog 文章中寫道。

"我們不了解「cancer」有時候指的是一種疾病(癌症)而有的時候指的是一種星座(巨蟹座),與何時某個查詢或某個網頁提到的是哪一個。"

此交易的財務費用並未公開,但未經查證的消息指出,微軟可能為了 Powerset 付出 1 億美元。

※ 不知搜尋引擎能否理解本文標題的雙關意義?相關報導:

行動上網新時代 大小搜尋引擎 誰適者生存?
Google 瀏覽器 大小通吃
線上研究刊物:太多是件好事嗎?
Infovell 尋找 Google 遺漏的深處網頁
機器人偵測行為暗示以聽從人類
橡膠手花招與自我意識
具有生物腦袋的「科學機器人」
人性機器的種子

1 則留言:

fsj 提到...

電腦也會思考?大哉問

【聯合報╱編譯王麗娟/報導】 2008.10.06

半個世紀前,偉大的英國數學家杜林提出電腦會否思考的大哉問,半個世紀後,六部電腦將與人類的「考官」進行對話,展開新一場的人機鬥智。有些電腦專家認為,這次若有電腦能過關,將是1997年電腦擊敗世界棋王後另一次人工智慧大突破。

英國觀察家報報導,本月12日,將有六個電腦程式,在英國瑞汀大學接受「杜林測試」。過程中,電腦將試圖騙過考官,證明他們也可以像人類一樣思考對話。對話將以文本(text),亦即以鍵盤敲出問題,從螢幕上看到電腦回答的方式進行,話題則天馬行空。如果電腦的反應與人類無異,即算通過測試,證明它確實有「思想」。目前仍無電腦通過杜林設計的測試。

任何過關的電腦,將成為第一部公認具有思考能力的機器,也將是1997年IBM超級電腦「深藍」戰勝人類西洋棋世界冠軍卡斯帕羅夫後,人工智慧的最重大突破。若是電腦能思考,人類也必須重新思考電腦是否有「意識」,而人類是否「有權」對它任意關機。

瑞汀大學的人工頭腦學家瓦威克教授認為電腦是有意識的,但它是以機器的方式思考,一如蝙蝠、老鼠也有意識,但它以蝙蝠、老鼠的方式思考,與人類並不相同。

接受大考驗的六個程式都有名字,包括「艾麗絲」、「傑洛米兄弟」等等。勝出的電腦,可獲得由「勒納人工智慧獎」(Loebner Prize in Artificial Intelligence)提供的一面18K金金牌與十萬美元獎金。

考官均為志願者,每人坐在一部電腦前。螢幕分成兩半,一半由看不見的人操作,一半由程式操作。考官可任選話題,與兩個螢幕展開分開但同時的對談。五分鐘之後,考官將研判和他們對話者哪一個是人,哪個是電腦,判斷錯誤或不確定,即算電腦過關。

根據杜林測試標準,瓦威克說,任何電腦只要有三成以上的騙人能耐,就過得了關。屆時人們將發現電腦也會說出情緒性字眼,甚至懂得調情。

即使有電腦通過考驗,還是會有人認為機器雖成功闖關,但並不知道自己在做什麼。倫敦大學伯克貝克學院的葛雷林教授即認為杜林測試非常粗糙,人們以為進行的是人機鬥智,實則是人與程式設計師鬥法。

※ 如果受測者知道相關的實驗目的,例如:請判斷對方(沒告知實驗者對方是電腦)是否說謊,電腦就很容易露出馬腳。