2007-10-12

未來,語言會如何演化?

Harvard scientists predict the future of the past tense
http://www.sciencecodex.com/harvard_scientists_predict_the_future_of_the_past_tense

Posted On: October 10, 2007

據哈佛大學一位數學家所發展的公式指出,動詞會以一種速率,逐步演化(evolve)且同質化(homogenize),其速率整好與其在英文中的普遍程度成反比。這位數學家訴諸演化原理來研究我們的語言在過去 1200 年來的變化,從「Beowulf(古英文史詩,描寫一位北歐勇士幫助國王斬妖除魔的故事)」到「Canterbury Tales(喬叟的「坎特伯里的故事」)」再到「Harry Potter(哈利波特)」。

刊載於本週的 Nature 期刊上,Erez Lieberman、Jean-Baptiste Michel 及其在哈佛 Program for Evolutionary Dynamics(演化動力學計畫)的同事,由 Martin A. Nowak 所領導,認為語言的發展在本質上就是一種演化結構(evolutionary scheme):如同基因與生物經歷天擇,單字 -- 特別是在過去式不採用 "-ed" 結尾的不規則動詞 -- 是在語言發展時受到強有力的「規則化(regularize)」壓力所支配。

"語言進化的數學分析顯示,不規則動詞的詞形變化以一種相當規則的方式進行 -- 可藉此獲得對未來動詞演化軌跡的預言與洞悉," Lieberman 說,哈佛工程與應用科學學院,以及哈佛-MIT健康科學與科技分部的應用數學畢業生,同時也是 Program for Evolutionary Dynamics 的成員。"我們測量了沒有人真的認為可以被測量的東西,並獲得顯著且漂亮的結果。"

"我們真的站在開發數學工具以研究演化動力學的前線," Michel 說,哈佛醫學院系統生物學的畢業生,同時也是該計畫的成員。"在此之前,語言被視為過於混亂,且很難進行系統性的數學研究,不過現在我們能成功的以量化方式,研究語言如何改變與發展。"

Lieberman、Michel 等人的研究,建立在先前對於古英文中動詞詞形變化中 7 條相互競爭規則的研究基礎上,其中 6 條隨著時間流逝,漸漸不再使用。

根據一種特定的數學函數(那以一種速率將其規則化,其速率與它們使用頻率的平方根成反比),他們發現倖存下來的一條規則,會在簡單過去式與過去分詞形態中添加一個 "-ed" 字尾,促成不規則英文動詞在演化上的衰敗。

換句話說,使用頻率不到 100 次的動詞,將以 10 倍速度演化。

為了開發這個公式,研究者透過中古英文接著是現代英文的語言改變,追蹤 177 個不規則動詞在古英文當中的狀態。

這 177 個動詞在 1200 年前都是不規則,在中古英文中有 145 個仍是不規則,而今日只剩下 98 個,像 help, laugh, reach, walk, 與 work 這些動詞在過去數百年來都被規則化。

Lieberman 與 Michel 的小組計算倖存不規則動詞的「半衰期(half-lives)」,預測它們要多久才開始規則化。最常見的那些,例如「be」與「think」,的「半衰期」(分別是 38800 與 14400 年),它們實際上都不會變成規則動詞。使用頻率較低的不規則動匙 -- 例如「shrive(懺悔)」與「smite(襲擊)」,其半衰期分別是 300 與 700 年 -- 很有可能屈服於規則化。

Lieberman、Michel 等人預計下一個要被「規則化」的單字很可能是「wed(結婚)」。

"現在,你最新的機會或許是「newly wed(新婚)」," 他們在 Nature 的論文中半開玩笑的說。"未來已婚的夫婦或許只能期待「wedded bliss(婚姻幸福)」。"

現存的不規則動詞代表廢棄已久之詞形變化規則的遺跡;新加入英文的動詞,諸如「google」,普遍來說都是規則變化。然而,不到 3% 的現代英文動詞是不規則變化,這包括下列 10 個最常見的:be, have, do, go, say, can, will, see, take, 與 get。Lieberman、Michel 等人預期,他們所研究的 98 個現代不規則動詞中 -- 雖然前十大,它們一個都沒有 -- 將有 15 個在未來 500 年會被規則化。

該小組的論文對某些讓語言學家懷疑很久的事,進行一個定量的、令人驚訝地精確描述:最常使用的不規則動詞,由於經常重複使用,因此它們不太可能會絕種。

"不規則動詞是化石,那展現語言學規則,以及或許是社會上的規則,如何誕生與死亡," Michel 說。

"如果你在你的資料上應用正確的數學結構,你會發現數學也會組織你對於整個過程的想法," Lieberman 說,他身為畢業生的非正統計畫,範圍從基因體學到太空醫學。"資料並沒有改變,不過突然之間,你能夠對未來進行強而有力的預測。"

Lieberman and Michel's co-authors on the Nature paper are Nowak, professor of mathematics and of biology at Harvard and director of the Program for Evolutionary Dynamics, and Harvard undergraduates Joe Jackson and Tina Tang. Their work was sponsored by the John Templeton Foundation, the National Science Foundation, and the National Institutes of Health.

※ 相關報導:

* Quantifying the evolutionary dynamics of language
http://www.nature.com/nature/journal/v449/n7163/abs/nature06137.html


Erez Lieberman, Jean-Baptiste Michel, Joe Jackson,
Tina Tang & Martin A. Nowak
Nature 449, 713-716 (11 October 2007)
doi:10.1038/nature06137
拉丁文式微 梵蒂岡救亡
google被納入韋氏大字典新字
這10個字 網友特愛查
中文成英語新詞最大來源
反全球化「百哩飲食」正夯/語言快速死亡
文明之網:無國界的人類進化史
一國的「產品空間」決定經濟成長
UAT 講師創造楔形與象形文字翻譯器
研究者完成 25 年來首度「網際網路普查」
Web 立方 -- 萬物即網路
電腦理解這些字有何意義(?)
以電腦挖掘數百萬種隱喻
科學家揭開新生兒第一個字的祕密

T型人才 縱橫Web2.0時代
藝術館鑿裂縫 雕刻家:鴻溝沒有底線

4 則留言:

fsj 提到...

鉅亨看世界 -- 拉丁文的逆襲

鉅亨網/2007/10/12

並不是說古羅馬人不知道 sex是怎麼回事,畢竟他們都在酒神 Bacchus的慶典上瘋狂縱慾享樂。但是當時沒有錄影的技術,所以在拉丁文中,並沒有一個單字可以用來表達「性愛錄影帶」。

《The Wall Street Journal》 報導,在拉丁語版的維基百科「Vicipaedia Latina」 中,編輯者們使用拉丁文來撰寫百科全書,而當他們編寫美國飯店大亨Hilton家族的狂野女兒Paris Hilton的條目時,就以「在網路上廣為流傳的的 Paris性愛片段」,來形容她的性愛影片事件。

要用人們穿著羅馬寬袍、駕著雙輪戰車時代的文字,來形容現在人們戴著肚臍環、開著休旅車的世界,還真需要一點即興創作的能力。Vicipaedia是由一小群喜歡拉丁文的業餘語言學家所共同經營。

他們的目標,是編寫出既流行又生活化的拉丁文百科全書--或至少可以讓這個已經沒有人使用的語言重回世俗。他們也使用真正的古典拉丁文,而非凱撒宮殿中用的那種庸俗華麗文體。

對那些認為拉丁文只存在於西塞羅的演講中的人,caveat emptor (後果自負)。「我們用的是古語沒錯,但它是用電腦寫下來的,而非紙莎草紙。」目前還是也是一位研究生的Josh Rocchio,是Vicipaedia相當活躍的一位編輯。「沒有什麼東西是不能納入Vicipaedia的,可以寫凱撒大帝,也可以寫藍起司。」

而Vicipaedia也讓更多人想要親近拉丁文。另一位編輯 Rafael Garcia說,「因為看小甜甜布蘭妮的資料,比讀凱撒征服高盧的資料有趣多了。」

維基百科是個人人都可進行編輯修改的網路資料中心。它現在已經擁有超過 200個語言版本,除了歐洲古語拉丁文擁有自己的Vicipaedia,中國文言文也有自己的版本「維基大典」。而英語是全球通用的語言,英語版裡的資料也是目前最多的,有 200萬筆以上的條目。

Vicipaedia目前已有 1.5萬多筆的資料,想當然裡面有羅馬詩人Catullus、Horace和關於羅馬元老院的條目,此外,也有musica rockica (搖滾樂)、GeorgiusBush (美國總統布希)和cadavera animata (僵屍)的話題。如果你對homo suspensus (猜字遊戲)、aeroplanum chartaceum (紙飛機)、pila magica 8 (占卜球)有興趣,或是想知道名人Leonardo da Vinci (達文西)、Super Mario brothers(瑪莉兄弟)的事情,甚至是熱門網路遊戲World of Warcraft (魔獸世界),在上頭都找得到。

另一位內容貢獻者Andrew Dalby說,「在21世紀做這件事情是有點奇怪。我第一次看到Vicipaedia的時候,還心想『這有什麼意義?』不過後來我也開始編寫文章,就迷上了。」

專業的拉丁文學者則說,Vicipaedia讓他們很印象深刻。剛開始學拉丁文的學生,通常都會犯很多錯誤,「但這些文章不錯,其實是非常好。」美國UCLA古典部主席 Robert Gurval說。

這是拉丁文的復甦。登入編輯的高中生在增加,因為他們希望申請進大學時,這樣嚴謹的作品會讓審核委員會驚豔。裡頭有關於幼教專家Dr. Seuss、貓王Elvis Presley和Harry Potter的條目。而在芬蘭--一個學拉丁文的好地方--每星期都有以拉丁語播出的廣播。

今年24歲的 Rocchio可說是現代拉丁文的代表人物。一般而言,只要提到「古典學者」,大部份的人所想像的,大概都是穿著花呢衣服、坐在一堆神學書籍旁,啜飲著波特酒的學者。不過 Rocchio只穿 T恤和牛仔褲,閒暇時,他還是搖滾樂團的鼓手。

他在大學原本打算主修物理與數學,但他在好奇心驅使下選了拉丁文,而且一學就愛上了它。「我喜歡它的結構和單純性,可以用簡單幾個字就表達出複雜的概念。」他現在已經是美國Maryland大學的拉丁與希臘研究生。

他在去年偶然和Vicipaedia相遇,當時,裡面的條目都是與羅馬軍事和戰爭有關的內容,恰巧當時也有幾個熱愛拉丁文的網友加入,於是他們打算共同合作,讓Vicipaedia變得更生活化。

Rocchio 所撰寫的內容兼具傳統與當代話題,他雖也寫了有關數學與西洋棋的條目,但個人最驕傲的作品則是美國人的飲酒遊戲 Beer Pong。他說,學術固然重要,不過大部份的使用者並非把Vicipaedia當作參考資料來源,而是當做練習語言的工具。

編輯們的工作方式大部份是合作性的,所以也很容易有爭執產生。其中一個爭辯話題就是電腦。英文的computer這個字,Vicipaedia中稱之為「computatrum」,但編輯Justin Mansfield強烈反對,認為這個字是不正確的示範。

Mansfield 也是古典文學研究生,他說,任意加上「trum」字根來造新字並不正確,因為這個用法已經失傳。就像英文裡的「th」,雖有「warmth」這個字,卻不能自創「coolth」。

Mansfield遊說大家不要用computatrum,但多數人還是贊成用這個字。後來他從善如流,創造了物理學名詞「particularum acceleratorium」(粒子加速裝置),並獲得一致通過。

Vicipaedia上大部份的題材都來自於英文版Wikipedia ,但如果一位編輯對某個話題有特殊偏好,就會特別深入撰寫。身為人類學教授,也是編輯之一的J.W. Love,就曾貼出薩摩亞語詩集的拉丁文翻譯。

現在根本沒有人會說拉丁文了,幹嘛還這麼麻煩?而大部份的Vicipaedia志工編輯都說,他們只是喜歡藉這個方式溫習以前在學校學的拉丁文。比如Garcia,他在美國麻州 Worcester Polytechnic Institute教物理,他就希望能把拉丁文練到夠好,讓他能讀牛頓《原理》的原文本。

fsj 提到...

韋氏字典年度單字 電玩歡呼語w00t當選

法新社 2007-12-13

(法新社舊金山十二日電)線上遊戲玩家自創的歡呼語「w00t」,今天獲美國知名字典出版商選為年度單字。

美國麻薩諸塞州的韋氏字典公司表示,中間通常以兩個數字0拼成的「w00t」,反映出玩電玩與傳送手機簡訊長大的世代,領導美國語言的新趨勢。

韋氏字典說,這個字就像是說「yay」一樣,「可以在獲勝後說,或沒為甚麼也可以說」。

登入韋氏字典網站的網友,獲邀從讀者最常在這個字典網站查閱的二十個單字與詞句中,投票選出一個。

票選第二名是「facebook」這個代表把某人加入Facebook.com朋友名單,或在這個社群網站搜尋某人的新創動詞。

韋氏字典社長摩斯說,「w00t」反映出越來越多人用數字來打單字。

他說:「人們在尋找一看就知道代表甚麼的數字─字母置換,0代替英文的O,3代表E,7代替T,4代替A。這只是表現字母更有效率的另一種方法。」

新奇科技產品專賣網「www.thinkgeek.com」已開始販售印有「w00t」字樣的T恤。Think Geek網站說:「w00t這個字屬於世界完結的玩家,似乎來自現在已不用的、『hoot』的另一種說法『whoot』,hoot是一種叫聲或訕笑。」

「但有些人認為,w00t是玩『雷神之鎚III』遊戲時,數名玩家跳過兔子等東西發出的聲音。」

fsj 提到...

大陸學者提50年內廢簡體字 中共:不可能

【聯合報╱大陸新聞中心/綜合報導】 2008.03.05

大陸進入簡體字時代已多年,簡體字的存廢始終是項議題。日前大陸文學評論家王幹一篇名為「五十年內,廢除簡化(體)字如何」的部落格,在網路上引起是否要廢除簡體字的激烈討論。

不過,中共教育部相關負責人第一時間表示,廢除簡體字是不可能的。

北京「新京報」報導,在這篇文章中,王幹從五方面論證自己的觀點。

首先,他認為當初推行創立簡體字,是為漢字拼音化道路做鋪墊,如今已證明拼音化走不通。其次,當初提出使用簡體字,是從實用角度來講,如今隨著電腦的普及,書寫漢字機率大大降低。

此外,王幹認為,簡體字給古典文化典籍帶來傷害,廢除簡體字,有利於海峽兩岸的統一,因為台灣、很多海外華人至今仍使用非簡體字。他同時強調,自己並不主張立即廢除簡體字,因為簡體字至少影響近三代人,一下子恢復繁體字,會帶來一定混亂,所以應該慢慢廢除。

中共教育部官員表示,廢除簡體字是不可能的,文字發展有自然規律,簡體字是趨勢,國家的基本政策和法規也有明確規定。

北京大學教授陸儉明也說,漢字從甲骨文到現在的楷書,總的發展趨勢是趨向簡單、中共建政初期實行漢字簡化,一方面是繼承前人工作,因為漢字簡化從清末就有人主張,另外也是因為中共政權成立時有九成的文盲率,急需掃盲,簡化漢字有利於此。在趨勢就簡的前提下,沒有再變回繁體的必要,具體到一些個別字可能需要調整。比如王幹提到的兩岸交流等問題,陸儉明認為可以實行「識繁寫簡」的方案,即認識繁體字使用簡體字。

另一位專家、中國社科院語言所研究員鄭張尚芳說,建議廢除簡體字的說法比較極端化,簡體字的確有缺點,但是並非不能更正。



◆ 菜單中翻英 簡體字鬧笑話

【聯合報╱記者林宜靜、陳智華/台北報導】 2008.03.05

對大陸討論簡體字問題,正醞釀向聯合國申請正體字(即繁體字)列入世界文化產的中文數位化技術推廣基金會表示,簡化字最大問題在於只考慮書寫方便,完全沒有考慮文化的傳承。

中推會祕書長魏林梅表示,簡化字如果拿來記錄日用事物或許足夠,但面對中國老祖宗豐富的文化遺產,使用起來就會捉襟見肘;中推會在推動中文數位化過程,一些電腦常用的簡體字與正體字「簡繁轉換」就造成許多混亂,容易影響資料的正確性。

例如,簡體用「干」取代「乾、幹」,但「白乾」與「白幹」如何區別?還有「乾隆、乾坤」不就變成「干隆、干坤」?甚至用「后」取代「後」,那「李後主」可能變成「李后主」,連男、女都無法區分。

她還舉了一個令人哭笑不得的例子,簡體字「干、乾、幹」都簡併成「干」。在美國矽谷的中餐廳,把菜單的簡體字「豉汁蝦球干炒河」翻成英文,「幹」英文是fuck,於是「乾炒河」的英文就變成fuck stir-fry rice-flour noodles。

捍衛正體字不遺餘力的前師範大學中文研究所長、教育部國語文編輯委員會主任委員李鍌表示,簡體字是1950年代為解決數量龐大的文盲而實施,目的在減少書寫時間,但文字的美都不見了。

根據教育部整理的常用、次常用、罕用字的正體字,共約2萬9563字,大陸採用簡體字只有2235字,份量不到十分之一,毫不足以代表中國文字。



◆ 美國中文熱 簡體字成主流

【聯合報╱華盛頓特派員張宗智/四日電】 2008.03.05

美國近十年來興起學中文的熱潮,大華府地區不少公立中、小學都已把中文增列為外語選修課程之一,教學上大致雖維持繁(正)體和簡體中文並用,但簡體字逐漸成為中文教學主流,已形成一股難以抵擋的趨勢。

隨著中國經濟勢力在全球崛起,在美國學中文已成為近年來最熱門的外語學習標的。

不過,馬里蘭州和維吉尼亞州兩地的華語教學雖一樣火紅,但使用的文字卻涇渭分明。十多年前就開始在蒙哥馬利郡的波多馬克區重點小學開辦「全浸式」(total immersion)中文教學的馬里蘭州,以正體字教學,但較晚開始的維吉尼亞州,主要以簡體字為主。

不過,以正體字為中文教學主軸的馬里蘭州公立學校,近幾年卻開始遭到不少家長質疑為何堅持使用正體字?

在馬州胡佛中學教授中文的劉老師說,馬州的中文課程,目前已規定教材必須正、簡體字並列。

但劉老師也就她接觸的經驗補充說,有趣的是,使用簡體字的要求,多數出自非華人家人,其實從中國大陸出身的美籍華人家長,反而很願意小孩學正體字。

不過,儘管華人世界對正、簡體字孰優孰劣的討論十分熱切,但多數學中文的外國人根本不在乎,他們重視的只是能夠在使用中文的社區中溝通,因此包括美國國務院對外交官的中文訓練,也是以溝通為主,文字為輔,正、簡字之爭,對他們而言意義甚小。

※ 所以人類是不是愈活愈後退?

fsj 提到...

1500字簡化版英文 菜英文救星

【聯合報╱紐約特派員林少予/14日電】 2009.03.16

有「菜英文」焦慮症的人,如果只求溝通無礙,不在意英文考試成績,不妨學習一種稱為「全球英文」的簡化版英文。

「全球英文」(Globish)是法國人奈希耶結合Global(全球)與English(英文)兩個字後自造的新字,用來描述世界各角落、英文非母語的人使用簡化版英文溝通的現象。

奈希耶20年前擔任IBM全球行銷副總裁時,經常與各國同事開會,他注意到一個現象:這些來自不同國家的同事們,講的都是扭曲、變形、不正確的英文,但卻溝通順暢,相反的,會議桌上的英國人與美國人往往是最沉默的一群,因為他們一開口就是太複雜的英文,沒人可以完全理解。

奈希耶退休後,開始推廣這種簡化版英文,並且出版了兩本法文書介紹這種工具,他的初衷是讓英文不太行的法國同胞在商場上能比較有信心運用英文。沒想到簡化版英文大受歡迎,他的書不僅在法國成為暢銷書,西班牙、義大利、南韓、日本也都有譯本,甚至連以英語為官方語言的加拿大都翻譯了他的書。

奈希耶說,學習全球英文只需要六個月就可以,因為這不是學習一種語言,而只是在學習一種工具。他開發了一套學習「全球英文」的軟體,可以透過網際網路教學,一開始從350個單字學習起,以後每星期增加35個單字。此外,奈希耶也開始替「全球英文」制訂一些規則,學習與使用更容易。