2009-04-30

新程式,能將化學名稱轉換成不同語言

New computer program promises to be 'Rosetta Stone' for chemical names
http://www.physorg.com/news160233216.html

April 29th, 2009

在一項進展中(那將協助加速全球性的新藥物發展,以及新商業化與產業產品的專利申請)新墨西哥一位科學家報告第一套能迅速且準確地將複雜化學名稱從某種語言轉換成另一種語言之電腦程式的發展。

這項研究出現在當期 ACS 的 Journal of Chemical Information and Modeling。

Roger Sayle 提到,一套用來命名化學物質的普適系統確實存在(譯註:IUPAC)。然而,將化學名稱從某一語言轉換成另一種,由於間隔(spacing,譯註:如何切字)、大寫的使用、拼法與其他因素中的差異,會是一件複雜的工作。例如,能適當地從英文翻成中文,常需用到經特別訓練的化學家,其能流利使用這兩種語言。雖然科學家數十年來都在嘗試建立能迅速將化學名稱轉換成另一種語言的電腦軟體,不過直到現在,這個領域的進展一直都很有限,Sayle 提到。

Sayle 報告一種強大電腦程式,稱為 Lexichem 的新版本發展,那能完成這些翻譯。這項研究描述該程式如何以 98% 的精確度,將來自英文、超過 25 萬筆的一群化學名稱翻譯成其他七種(British, American, German, Japanese, Chinese, Spanish, Swedish, Polish, and Hungarian)語言(或翻回來英文)。

※ 相關報導:

* Foreign Language Translation of Chemical Nomenclature by Computer
http://pubs.acs.org/doi/abs/10.1021/ci800243w

Roger Sayle
J. Chem. Inf. Model., 2009, 49 (3), pp 519–530
doi: 10.1021/ci800243w
以電腦挖掘數百萬種隱喻
唯一 下載次數可預測科學文章的影響力?
研究者找到最佳化的 fix-free codes
發現科學新知的電腦與機器人
日本小孩機器人模仿幼兒學習

1 則留言:

fsj 提到...

翻譯軟體凸槌多 IBM匯集經驗研發聰明語譯
http://mag.udn.com/mag/digital/storypage.jsp?f_ART_ID=223287

聯合新聞網 2009.11.24

澎湖七美島竟翻成「七個美國」(Seven America),翻譯軟體鬧笑話其實已非新聞。IBM匯集員工之力研發更聰明的翻譯軟體,機械翻譯可望變「更有人性」。

翻譯機、翻譯軟體以及日趨普遍的線上翻譯,依賴程度較高的使用族群,多半對於另一種外語懂得不多或甚至完全不懂,所以需要借由這些機械式的翻譯工具幫忙進行轉換。

問題是,正因為這些使用者對於需要轉換的外語不懂、不太瞭解,沒有能力辨別機械翻譯的正確度有多少,翻譯結果一律「照單全收」,因此常鬧笑話。

有外籍遊客到中國大陸觀光,在某地驚見「餐廳」中文招牌旁邊所出現的英文翻譯竟然是TranslateServer Error(翻譯主機錯誤),隨手將如此「奇景」拍下照片並放到網路當成趣聞分享。

語言是人類的基本溝通工具,全球化趨勢讓不同語言之間的溝通變得更為密切、頻繁。不懂外語的人如果想跟外國人溝通交流,自然得求助於機械翻譯,這家餐廳老闆想必正是如此。

但由於無法判斷機械翻譯的答案是否可靠。就連主機當機時跳出來的錯誤訊息,因為寫的是英文字,餐廳老闆「想當然爾」以為這就是「餐廳」一詞的中翻英,就拿來高高掛起當招牌了。

另一種常見的狀況則是,機械翻譯無法瞭解生活上的語境。

如果不熟悉台灣流行文化的環境,例如Google線上翻譯對「我喜歡聽豬頭皮」這句中文,只能翻出I liketo listen to pig skin(我喜歡聽豬的皮),無法翻出句中「豬頭皮」其實為知名的台灣音樂創作者兼歌手。

如何把冷冰冰、既不懂變通也缺乏實際生活經驗的機械式翻譯,變成確實能夠「聽得懂人話」且不會因為溝通誤差而鬧笑話的語言工具,其實是一大挑戰。

國際商業機器公司(IBM)新研發的智慧型翻譯軟體n.Fluent,或許能幫機械翻譯的未來發展提供思考方向。

IBM企業集眾人之力研發出來的翻譯工具n.Fluent,用過它的IBM員工來自全球170多國、人數約40萬,實際負責這項軟體研發的工程師、數學家近100人。它以提供電腦網頁、電子文件檔案、網路即時通訊甚至黑莓機智慧手機上的同步翻譯。

每一次只要有人使用n.Fluent,它的翻譯主機就會從中「學習」實際經驗,讓龐大主機資料庫越來越豐富、靈活、更「有人性」。據IBM統計,這套n.Fluent翻譯工具從2008年8月上路,翻譯字數已經超過4000萬字。

能將英文翻譯成中文、日文、韓文、法文、義大利文、俄文、德文、西班牙文、葡萄牙文、阿拉伯文的n.Fluent,雖然被IBM形容為「企業內部使用的一項軟體」,但未來不排除將它擴大成為對外界提供的新產品或服務。

※ 相關報導:

* IBM內部測試n.Fluent自動翻譯工具
http://www.zdnet.com.tw/news/software/0,2000085678,20142986,00.htm



◆ Windows 8將於2012年發表?
http://www.ithome.com.tw/itadm/article.php?c=58281

文/陳曉莉 (編譯) 2009-11-24 iThome online

Microsoft Kitchen部落格引用微軟於PDC會議中展示的文件,猜測Windows 8的發表時程應在2012年;而國外科技媒體也據此猜測Windows 8的可能上市時間。

微軟甫於上個月發表最新的Windows 7作業系統,但「微軟廚房 」(Microsoft Kitchen)部落格已引用微軟於PDC會議中展示的文件,猜測Windows 8的發表時程應在2012年。

Microsoft Kitchen揭露的是微軟Windows Server的發表時程,根據該時程,微軟將於2012年釋出代碼為Windows 8的主要版本。

微軟先前曾承諾新作業系統的開發時程為3年,微軟於2007年1月發表Windows Vista,而Windows 7則在今年10月發表,依照微軟的規畫,Windows 8理應要於2012年出爐。

隨著Windows 7的上市,微軟已展開新作業系統的規畫,專門撰寫視窗平台新聞的Codename Windows報導,微軟近日正招募一資深經理,負責協助微軟合作夥伴迎接新的產品,微軟於職缺說明中舉例,像是2010財年的焦點是Windows Server R2、SQL Server R2、Wave 14等,而即將進入的2011財年則鎖定Windows 8。微軟的2011財年將自明年7月1日算起。

這代表微軟自明年中開始就將提供合作夥伴有關Windows 8的技術訊息。

一名自稱是微軟員工的Robert Morgan上個月在商業社交網站LinkedIn的自我介紹中透露,微軟正在開發128位元的Windows 8及Windows 9,微軟並未證實此一消息,但如果該訊息屬實,這將是Windows 8首個曝光的技術規格,同時代表視窗作業系統將自現有的64位元邁入128位元的時代。(編譯/陳曉莉)