2008-07-18

線上研究刊物:太多是件好事嗎?

Research Publications Online: Too Much of A Good Thing?
http://www.physorg.com/news135525459.html

July 17, 2008

網際網路使科學家與研究者能立即存取數量驚人的學術期刊。在彈指之間就能擁有這麼豐富的資訊,會產生什麼樣的衝擊呢?這個答案,根據刊載於今日 Science 期刊中的新研究,令人驚訝 -- 學者在其研究中所引用的文獻數量事實上會比較少,而且他們會傾向引用更新近出版品當中的文獻。這種趨勢也許會限制新點子與新理論的創造。

James Evans 是芝加哥大學社會學助教授,他聚焦於學術研究的本質上。在一次針對私人企業資金對研究影響的演講中,一位學生反而問及網際網路的成長如何形塑科學。 Evans 在上週的訪談中表示,"我並沒有一個直接的答案。"

Evans 發現,當他回顧有關網際網路與科學的研究時,那大部分都聚焦在更快速、更寬闊的網際網路讓學者能搜尋資訊,而非這個媒介本身如何衝擊他們的研究上。"這就是研究動機之所在。我想要知道電子供應如何改變了科學,而非那使它變得有多好," 他說。

在獲得 NSF 的支持以探索這個問題後,Evans 分析一個有超過 3400 萬篇文章的資料庫,並針對「從 1998 到 2005 年它們在線上的可利用性」與「從 1945 年到 2005 年它們被引用的次數」進行比較。結果顯示,當期刊上線的期數愈多,文章被引用的次數愈少,而且人們會傾向引用更加新近的刊物。

學者們的引用也似乎集中在更加特定的期刊與論文上。"雖然可用的變多了," Evans 說,"但做為例子的卻變少了,而且所取樣的是更加新近的,並位於最突出的期刊中。"

Evans 的研究亦發現,這種趨勢並沒有均勻地分布在所有學科中。生命科學中的科學家與學者明顯有最大的傾向參考較少的論文,但這種情況在商業與法律學術成就中則較不顯著。在人文科學中,社會科學家與學者與其他學科相較,更有可能引用更新的研究。

所以在線上與在一座實體圖書館進行研究,是什麼對研究如此關鍵,以致於改變了文獻回顧?Evans 確認了幾個可能的解釋。在深入探究研究如何進行時,那顯示人們在圖書館中瀏覽與閱讀材料,不過他們更傾向在線上搜尋文章。線上搜尋傾向透過日期與相關性來安排(搜尋)結果,那導致學者與科學家從最受矚目的期刊中挑選最近的研究。某些搜尋工具,例如 Google,把其他使用者在類似搜尋中,選擇某一項目的頻率做為因素以決定相關性。在線上,研究者也更有可能隨著已成為超連結的參照與連結抵達某線上資料庫中的類似研究。因為這樣,當更多學者選擇閱讀與參考所給定的文章時,未來研究會更快速地跟進。

這種現象意味著文獻回顧的末日將近?Evans 不這麼認為,但他相信那會使學者以及科學家更有可能趨向一致並在一給定主題上更快速建立傳統智慧(conventional wisdom,傳統觀點,似是而非的認知)。"線上存取使科學所掌握(picked up)的、以及後續研究所建立的更容易匯流(convergence)。" 他相信其中的危險是:如果新點子與理論沒有迅速地被研究社群所掌握,那麼它們也許在它們有益的影響被評估之前就會逐漸消失。"那好比新電影。如果電影在上映的第一個週末不受青睞,它們就會悄悄下檔," Evans 說。

Evans 計畫和語言學家與電腦科學家一同研究,藉此探索點子如何在文章中表達,以更了解失去舊點子的後果是什麼,以及它們如何能被挽回(retrieved)與復甦(resurrected),這樣一個挑戰,他認為在知識的追尋中相當重要。"當科學與學問在線上愈來愈多時,那些沒有很快受到注意的發現與構想,將比以往更迅速被遺忘。"

※ 看來這是一個界面與演算法的問題,也逃不過「連結」的掌心。

* Electronic Publication and the Narrowing of Science and Scholarship
http://www.sciencemag.org/cgi/content/abstract/321/5887/395
James A. Evans
Science 18 July 2008: Vol. 321. no. 5887, pp. 395 - 399
DOI: 10.1126/science.1150473
* Negative perception of blacks rises with more news watching, studies say
http://www.physorg.com/news135517277.html

新聞看愈多,對黑人的負面認知愈多

* Context is everything: New research uncovers key to consumer preferences
http://www.physorg.com/news135509807.html

文章脈絡是王道,新研究發現客戶偏好的關鍵。

研究:E-amil 行銷中的個人資訊可能適得其反
你還在看新聞嗎?
書所提供的自由與不自由
資訊越多、知道越少 (更新)
視覺研究:為何人們在群眾中不會引人注目?
什麼是色盲?
3個月大嬰兒對指涉物體的情緒暗示敏感
「心靈之眼」影響視覺感知
研究:背景如何支配我們信什麼就看見什麼
老狗變不出新把戲:知識影響客戶如何接受新資訊
研究:當人覺得有權勢 他們會忽略新意見
你要NHK、BBC 還是我們自己的公視?
藝術館鑿裂縫 雕刻家:鴻溝沒有底線

連結 - 讓60億人串在一起的無形網路
百大另類搜尋引擎
行動上網新時代 大小搜尋引擎 誰適者生存?
「鹵莽」軟體更新 更快發現「對稱」
Supple:自動產生適合你的電腦界面
心智圖線上
關於文章的分類...

* udn數位資訊 - 未來的「搜尋」模式
http://mag.udn.com/mag/digital/storypage.jsp?f_MAIN_ID=315&f_SUB_ID=2926&f_ART_ID=136502

* Quand internet s’immisce dans la vie réelle - Geek and Hype
http://www.geekandhype.com/2008/07/10/quand-internet-simmisce-dans-la-vie-reelle/

3 則留言:

fsj 提到...

新搜尋引擎 Cuil 與 Google 一較高下

◆ 新搜尋引擎Cuil推出 鎖定Google一較高下

中央商情網 2008-07-28

(中央社舊金山2008年7月28日美聯電)工程師安娜.派特森研發的上一個網路搜尋引擎令人印象深刻,產業領導品牌Google慧眼識英雄,立刻將技術買下,以更新自己的系統。但派特森相信,她最新的發明價值更高,只是這一次不賣。

相反的,派特森打算利用這個發明,與Google一較高下;派特森前年離開Google,想要研發更全面、更有效的網路搜尋方式。

她最終的成果就是Cuil(發音如cool),靠著三千三百萬美元的創業投資,這個搜尋引擎計畫今天首度開始處理使用者的搜尋要求。

這段時間Cuil一直保持低調,因為派特森、她的夫婿柯斯蒂羅,以及另外兩位曾任職於Google的工程師鮑爾與莫尼爾,不斷尋找更好的搜尋方式。

首先,Cuil的搜尋索引涵蓋一千兩百億個網路頁面。派特森相信,這是Google索引的三倍,不過這無法證實。

Google將近三年前的目錄涵蓋八十二億個網路頁面,但從那時起Google便不曾再公開計算其搜尋目錄的規模。

Cuil研發出一套模式,能以比Google更少的電腦,涵蓋範圍更廣的網頁,但Cuil不願透露這套模式。而Google也不願意示弱,發言人華森女士說,Google仍相信自己擁有最大規模的索引。

接獲有人打探Cuil的消息,Google二十五日在部落格上宣稱,Google定期查閱一兆個獨特的網頁連結。但是Google說,它並未將這些連結編入索引,是因為他們有的指向類似的內容,或是會在其他方面降低搜尋結果的品質。這項公告並未公布Google索引的數量。

搜尋引擎的索引規模非常重要,因為除非資料庫中儲存各種資訊、圖片與內容,否則根本無法搜尋到。但是Cuil相信,它在許多方面表現都比Google好,包括確認與展示結果的方式。

派特森說,Cuil的技術不打算模仿Google排列網站連結次數與品質的方式,而將深入網頁的實際內容。此外,Cuil將以更類似雜誌的形式來呈現搜尋結果,而不只是垂直排列網頁連結。Cuil展示搜尋結果,是在頁面上水平散佈更多的圖片,並提供「側邊欄檔案」,點選此欄便可得知更多與原始搜尋要求相關的主題。

最後,Cuil希望透過保證不保留使用者搜尋狀況與搜尋模式的資訊,來吸引使用者;Google保留使用者資訊的做法,令隱私權保護團體相當震驚。

※ 搜尋評分,我給... 唔... 55 分,它似乎使用關鍵字來索引。

* Can Cuil's new search engine capture the salmon of knowledge? - guardian.co.uk
http://blogs.guardian.co.uk/technology/2008/07/28/can_cuils_new_search_engine_capture_the_salmon_of_knowledge.html

Jack 大叔的觀點

* BBC NEWS - Irish myths behind engine name
http://news.bbc.co.uk/2/hi/uk_news/northern_ireland/northern_ireland_politics/7529029.stm

這篇提到 Cuil 是蓋爾語當中的 "知識" 與貞子... ㄜ... "榛" 才對。

* New search engine takes aim at Google - Webware : Cool Web apps for everyone - CNET
http://news.cnet.com/8301-17939_109-10000379-2.html

* Former Google Engineers Launch Search Engine - WSJ.com
http://online.wsj.com/article/SB121721408704288951.html

華爾街姊姊的看法。

fsj 提到...

「內容自動產出技術」?
http://mag.udn.com/mag/digital/storypage.jsp?f_MAIN_ID=313&f_SUB_ID=2917&f_ART_ID=131873

陳徵蔚 2008/06/23 聯合新聞網

資訊量產時代的省思與契機

除了「個人數位出版」之外,以人工智慧發展出的「內容自動產出技術」(Automated Content Authorship)同樣顛覆了傳統的出版概念。根據紐約時報2008年四月十六日的報導,歐洲商業管理學院(INSEAD)客座教授帕克(Philip M. Parker)自詡為世界上最多產的作家。他號稱可以利用六七十部電腦,搭配人工智慧程式,在短短十三分鐘內完成一般學者可能要花數個月才能收集的資料,然後電腦將自動輸出內容、繪製圖表,安排章節,最後排版成書。

透過這種「自動內容產出器」,他已經出版了超過二十萬冊以上的書籍,其中許多在亞馬遜書店(amazon.com)販售,採取POD模式,只要讀者下訂單,就能即時列印、裝訂、出貨。最近,他甚至嘗試利用這個技術寫詩、寫小說。他將自己利用電腦軟體創作的過程放上Youtube,登時掀起了廣泛討論(http://tw.youtube.com/watch?v=SkS5PkHQphY)。

當然,以目前的技術,這樣的著作頂多只能算是網絡資料彙整而已,書中沒有任何主觀的研究創見,內容品質不高明,銷量當然也不甚理想。有位澳洲讀者買了一本帕克所編著有關玫瑰痤瘡(rosacea)的書,看完後大失所望,因為他發現這本書根本就是個網絡資訊大雜燴,沒有任何針對這種皮膚病的具體研究,更無法解答他的疑難。針對相關質疑,帕克坦承,他的書並不是真正的學術著作,而是幫助那些不懂得上網的人蒐集資訊罷了。特別是某些冷門的議題,極少作者願意研究、出書,他的書便可以派上用場。至於那些懂得使用網路的人,帕克則建議他們不需要花錢購買他的書。紐約時報的新聞披露之後,購買帕克「著作」的讀者,自然更加稀少了。

雖然如此,帕克透過人工智慧來處理繁瑣枯燥的資料蒐集,然後放置在虛擬書籍通路販賣的構想,卻仍然十分充滿創意,值得我們思考。此外,他將自己比喻為出版界的福特(Henry Ford),這也是非常有趣的觀點。福特於1903年成立汽車工廠,採行「裝配生產線」(assembly line)量產汽車,大幅改善傳統的汽車裝配速度,並有效降低成本,令T型車獨霸市場。1914年改良後的福特生產線每93分鐘便可製造一台車,這個產能遠大於當時世界所有車廠的生產總值。截至1927年該型車停產為止,福特共生產了1,500萬輛汽車,每台造價僅800美元,遠低於其他車廠2,000到3,000美元的價格。產量大、價格低廉,品質可靠,成為福特當時的成功關鍵。

也許有人鍾愛勞斯萊斯「幽靈」與「幻影」系列手工打造的質感,以及限量生產的尊榮品味;然而「量產」卻是現今工業主流。「裝配生產線」不但產量大、成本低,同時也代替人類處理了繁瑣且枯燥的重複性工作,大幅提昇精確性與可靠性。這樣的概念如今看來理所當然;然而在一個多世紀以前,卻是非常創新而難得的想法。同樣地,利用電腦取代枯燥而繁瑣的工作,協助蒐集資料、彙整成書,這樣的構想現今或許看來瘋狂,同時也讓人對於電腦的「判斷力」充滿深深的不信任感;然而這或許是由於當前資訊技術發展尚未成熟的必然現象,隨著人工智慧科技日新月異,未來利用類似模式出版「文獻探討」與「書目研究」,特別是冷門、枯燥的學門,或許會成為常態,而不是奇想。甚至,可能因而讓知識的彙整更加高速化、標準化。將枯燥的工作留給電腦,人類的大腦便可以進一步解放出來,從事更加具有創造性的工作。相信人類直覺,這是技術未成熟時的正常反應;然而當技術發展至一定水準後,機器通常可以補強人力之不足,甚至做得更好。

當奕棋電腦「藍海」(Deep Blue)於1997年首次擊敗世界棋王斯帕洛夫(Garry Kasparov)後,人們開始正視電腦可能超越人腦判斷的可能性。艾西莫夫(Isaac Asimov)的知名科幻小說《機械公敵》(I, Robot),或是電影《駭客任務》中所擔憂,機器取代人類的場景未必是空穴來風。早在電腦技術成熟前,機器輔助人力的例子早已屢見不鮮。在航空領域,導航系統可以大幅降低駕駛員的錯誤判斷,因為人體感官常常出現錯覺,機器的穩定性反而比較高。汽車的防鎖死剎車系統(ABS — Anti-brake System)可以製造人體所無法達成的「點煞」效果,提高車輛穩定性。而防側翻系統則是利用電腦監測高速過彎時的四輪壓力分配,透過自動調整速度,來預防人腦所無法感知的車輛側翻風險。這些,都是機器輔助人腦的例子,而在很多情形下,現代人越來越相信電腦,而未必是人腦。

同樣地,遠在印刷術成為主流前,「抄寫員」是重要的資訊傳承者,他們在早期通常是修道院的僧侶,將抄寫視為「苦修」的一環。他們的手稿字體優美,內容記錄也十分嚴謹。因此,當印刷術最早出現時,人們難免對機器產生的文件產生懷疑,因為他們相信親手書寫的文件,比機器更具人性,也更可信賴。更重要的是,當時的人們相信抄寫員的專業,相信由人來撰寫的東西一定比機器好。而當時的印刷技術尚未成熟,排版、印刷時經常有錯誤,因此中古時代甚至許多印刷品都模仿手寫稿付梓。手抄稿不只是資訊保存與傳遞的媒介,同時也如同中國的「書法」一般,是種獨特的藝術形式。然而,時至今日,印刷品早已成為了資訊傳遞的權威媒介,透過層層的編輯與校定,其準確度與可信度早已遠遠凌駕手寫稿。不只是書報印刷,甚至在學校中,如今的老師普遍希望學生以電腦打字,然後將報告列印出來繳交。使用手寫,反而會讓老師覺得學生敷衍、不認真。除非是知名作家的手稿,可能還有典藏價值,否則一般人的手寫稿根本不具意義,甚至有更多的人完全不經由手寫過程,直接打字列印。

技術的改良,讓原本的「權威」被棄置不用,而剛開始不被信任的媒介則成為了主流。同樣地,原本被視為可靠的人體感官,逐漸在技術進步後被發現其侷限性,也因而機器輔助成為了現代技術的主要目標。雖然今日「內容自動產出」聽來荒誕不經;然而將資料蒐集整理,並將過程標準化,令整合、編輯、輸出形成一條完備的「生產線」,就能夠讓網絡使用者自行編排,然後出版成書。目前,這種人工智慧不失為一種有效的「輔助技術」,而在不久的未來,也極有可能成為「技術主流」,成為人類的資訊保存與整合的重要工具。

過度氾濫的資訊,絕對是無效資訊。而透過搜尋引擎的關鍵字搜尋模式,可以將散置各處的資料統合起來,形成有用的「知識資源」。邇來類似的關鍵字搜尋技術逐漸發展,人類運用知識的方式也逐漸進入高速時代。在過去,透過圖書館的「書目卡」(book catalogue)與「索書號」(call number)來尋找資料是唯一的途徑;然而今日這樣的方式已成過去,現代人透過巧妙的關鍵字運用,便可以在彈指之間,於網絡資料庫中找到過去研究者可能要經年累月才能整理完備的資訊。這種進步是過去所想像不到的,而當然,類似的人工智慧技術發展到極致,便勢必會產生如同帕克的構想,出現自動整合、產生知識的「內容自動產出器」。

在威爾斯(H. G. Wells)於1895年所撰寫的科幻小說《時光機器》(Time Machine)中,曾經描寫一個虛擬的圖書館員,他以立體投影的方式顯像,資料庫中包羅萬象,可以與人互動溝通,像個博學的教授,而不是死板的資料庫。類似的構想,將是人工智慧產業的重要趨勢。未來,我們的圖書館可能是對答如流的機器人,同時也是人工智慧所產生的詩人、小說家。這些雖然都是科幻小說中的產物,卻是如今正在逐步實現的目標。

透過不斷的校正與研發,未來的出版的書籍也許不再一定需要由「人類」撰寫,書籍可以像量產的汽車一樣,快速製造,甚至針對讀者的特定需求,不但「即時列印」(POD),而且可以「即時編撰」(EOD — Edit on Demand),甚至「即時產生內容」(ACGD — Automatic Content Generation on Demand)。未來的研究者不再需要花時間編寫書目,查詢資料庫,他只需要輸入幾個關鍵字,就可以透過人工智慧的自動篩選,取得難以想像的豐富資訊。這樣的構想今日看來或許像是白日夢;然而誰能想像在二十年前,我們在沒有網際網路與搜尋引擎的時代,是如何進行研究與資料蒐集?而當時的學者,又如何能夠想像今日的資訊流通與爆炸,甚至透過幾個關鍵字,每個人都可以掌握知識,成為「專家」?未來的出版業,也許不再只是煩惱「內容」(contents)的提供,而是如何處理、解讀大量資訊。這將是一個值得我們引頸期盼的新時代!

※ 本文正好是相關報導的反證。

fsj 提到...

知識來去匆匆 大腦變抽水馬桶

【聯合報╱大陸新聞中心/綜合報導】 2008.09.30

全民「大搜索」時代已然來臨。今年九月,全球最強大的搜尋引擎Google滿十歲,英國傳出近半英國人患上「Google依賴症」之際,大陸也有六成網民染上「搜尋依賴症」,每天至少使用一次百度或谷歌(Google)搜尋資料。其中,高達百分之四十四點七一的網友,是「重度」使用者。

廣州日報一篇文章評論,指無限的搜尋引擎讓人類有限的大腦實現任意銜接,然而,「搜尋成癮」帶來的思考惰性,讓越來越多的網友思維趨於簡單化。

由於百度和谷歌等搜尋引擎具有強大功能,很多上班族染上「搜尋依賴症」。大陸一群「史上最牛的職場達人」宣稱,自己達到「三不境界」,即「不記憶任何資料、不思考任何問題、不撰寫任何文案」。

許多網路年代成長的大陸年輕人,日常生活更是完全依靠搜尋引擎。二十四歲的媒體從業人員方志濤說,「這年頭,還有誰上網不用搜尋功能的嗎?從早上一睜開眼睛,去那兒吃飯,坐那路公車,文案怎麼寫,下班後去那裡K歌,那裡有購物打折,甚至突然想知道某位久違朋友的消息,都可以立刻上網搜一下。」

專家警告,過於依賴搜尋引擎,小心大腦變「抽水馬桶」。心理學家張怡筠博士表示,對搜索引擎過度依賴,讓許多人不再費力記憶,不再思考問題,不想為一個觀點爭論。「不記、不想、不爭」,使得一些年輕人的大腦像抽水馬桶,一切知識都來去匆匆,喪失最基本的累積功夫。

※ 因人而異吧~搜尋可以讓累積的知識更加有條理,更加觸類旁通。