http://www.physorg.com/news160994102.html
By Lisa Zyga, May 8th, 2009
(PhysOrg.com) -- 數百年來質數(prime numbers,素數)使好奇的思想家著迷。在一方面,質數在自然數(natural numbers)間似乎隨機分布,除了偶然之外沒有其他法則。但在另一方面,質數的整體分布卻展露出一種引人注目的平滑規律性。這種隨意與規律性的結合促使研究者搜尋分布當中的模式(patterns),那最終也許能闡明它們的終極本質。
在最近一項研究中,西班牙 Universidad Politecnica de Madrid 的 Bartolo Luque 與 Lucas Lacasa 在質數中發現一種新模式,到目前為止,那令人驚訝地未被察覺。他們發現質數序列的領導位數(leading digit,譯註:例如 5671 當中的 5)能用一般化的 Benford's law(班佛定律)來描述。此外,同樣的模式也出現在其他數序中,包括 nontrivial Riemann zeta zeros,那已知與質數的分布相關。除了對於質數的本質提供洞見外,這項發現在詐騙偵測與股市分析這樣的領域中,也可能有其應用。
"數學家研究質數已有數百年了," Lacasa 表示。"來自非線性科學(例如乘數過程 (multiplicative processes))的新洞見及概念幫助我們以不同觀點看待質數。根據這項焦點,「即使不是數論專家,都仍有可能在這種序列中發現那些未被察覺的統計規律性的暗示」這件事變得益加顯著。"
"然而,在該研究中最重要的問題並非揭露質數與 Riemann zeros 中的這種模式,而是理解原因,以及這種非預期結構的蘊含,那不只是為了數字的理論性問題,也為了趣味性,對其他學科而言亦然。例如,這些結果端賴我們對於眾多元素所組成之系統中之相關性的理解。"
Benford's law(BL),在 1938 年以物理學家 Frank Benford 為名,描述在各種資料組與數學序列中,數字之領導位數的分布。有點令人意外地,領導位數並非隨機或均勻地(uniformly)分布,它們是對數的(logarithmic)分布。亦即,第一位數為 1 者,出現時間約佔 30%,而後續數字(digits)出現的頻率則愈來愈低,而 9 常敬陪末座。Benford's law 經證明能描述不同的資料組,從物理常數到世界河流的長度。
自 1970 年代末期起,研究者已知質數本身,當考量非常大的資料組時,並不會根據 Benford's law 來分布。相反的,質數的第一位數分布似近乎均勻。然而,一如 Luque 與 Lacasa 所指出的,較小的質數資料組(以較小間距選出來的集合),在第一位數分布中展現出一種明顯的偏差。研究者們注意到另一種模式:當他們所分析的質數資料組愈大,第一位數分布會益加接近均勻。據此,科學家納悶,這裡是否存有任何模式,在質數間距增至無限大時,構成這種朝向均勻趨勢的基礎。
所有質數的集合 -- 如同所有整數的集合 -- 為無限大。從統計學的觀點來看,這類分析的困難性之一是:如何在一無限大的資料組中以「隨機」方式進行選擇。正因如此,必須選擇一種有限的間距,即便那在某種程度上滿足機率法則,亦不可能達到完全地隨機。為了克服這一點,研究者們決定要選擇模型(shape)[1, 10^d] 的幾種間距;例如:1-100,000,d = 5 等等。在這些集合中,所有第一位數很可能為先驗相等。所以,若某種模式在一質數集合中的第一位數浮現,那將揭露關於質數第一位數的某種分布(只有在該集合中)。
Luque 與 Lacasa 在 d 增加時藉由觀察乘數集合,因而能研究當資料組增加時,質數的第一位數分布如何改變。他們發現質數遵循一種大小相依的(size-dependent)Generalized Benford's law(GBL,廣義班佛定律)。GBL 描述由乘冪律分布(power law distributions,例如 [1, 10^d])所產生之級數的第一位數分布。當 d 增加,質數的第一位數分布變得更加均勻,遵循 GBL 所述趨勢。一如 Lacasa 的解釋,BL 與 GBL 適用於自然中的許多過程。
"想像一下你銀行帳戶中有 $1,000,月利率為 1%," Lacasa 說。"第一個月,你的錢將變成 $1,000*1.01 = $1,010。下個月則是 $1,010*1.01,等等。在 n 個月後,你將有 $1,000*(1.01)^n。注意,你將需要很多個月才能從 $1,000 變成 $2,000,然而你從 $8,000 到 $9,000 將會更加容易。當你分析你的帳戶資料時,你將理解到,第一位數 1 比 8 或 9 更常出現,正如同 Benford's law 的支配。這是一種非常基本的乘數過程例子,在此 0.01 為乘法的常數(multiplicative constant)。"
"物理學家已證明,自然中有許多過程能被塑模(modeled)成隨機的(stochastic)乘數過程,在這裡,先前所提的 0.01 常數值,現在變成一種隨機變數,而那些相當於我們在後例所提到的「錢」的資料,則是另一種隨機變數,具有一種基本的(underlying)1/x 分布。具有這種分布的隨機過程(stochastic processes)經證明遵循 BL。現在,許多其他現象因一種更一般性的、基本的 x^(-alpha) 機率,而與隨機過程更加相符,在這裡 alpha 不等於 1。與這種廣義乘冪律分布相關的第一位數分布,即所謂的 Generalized Benford law(若 alpha = 1 則收斂到 BL)。
很顯然地, Luque 與 Lacasa 在他們的研究中證明了 GBL 能以質數定理來解釋;尤其是這些序列的平均區域密度(mean local density)模型(shape)為此模式的成因。研究者們亦開發出一種數學框架,那為任何分布提供條件以符合 GBL。這些條件建立在先前的研究之上,那已證明若某一分布之參數的特定值遵循 BL,則 Benford 行為可能會發生,一如質數的例子。Luque 與 Lacasa 也研究 nontrivial Riemann zeta zeros 的序列,那與質數的分布相關,而且其 zeros 的分布被視為最重要的未解決數學問題之一。雖然 zeros 的分布並沒有遵循 BL,不過研究者在此發現,它確實遵循一種與大小相依的 GBL,一如質數的例子。
研究者們指出這項研究可能有幾種應用,諸如確認其他非 Benford 分布,但也許是 GBL 的序列。此外,許多已為 Benford's law 發展的應用最終也能被一般化,成為 Generalized Benford's law 更寬廣的脈絡。這樣的一種應用之一是詐騙偵測:一般來說,自然產生的資料遵循 Benford's law,隨意瞎猜的(騙人的)資料則否。
"BL 是 GBL 的「特例」," Lacasa 解釋。"自然中許多過程在 alpha = 1 時能與 GBL 相符,例如 BL。當數字經過人為修改後,Benford's law 量化時的隱匿結構就會喪失:這是會計中詐騙偵測的一種原理,在此,與會計集合相關的組合機制(combinatorial mechanisms)為 BL 的應用之處。那些以某種一般 alpha 遵循 GBL 的過程,保持相同原理,在此 BL 失效。最後,對那些基本密度並非 x^(-alpha) 而是 1/logN 的過程而言,一種與大小相依的 GBL 將會是正確的正字標記。"
※ 相關報導:
* The first-digit frequencies of prime numbers and Riemann zeta zeros
http://rspa.royalsocietypublishing.org/content/early/2009/04/17/rspa.2009.0126
Bartolo Luque and Lucas Lacasa* 《銀河便車指南》中 42 所代表的意義?
Proceedings of the Royal Society A, accepted March 23, 2009.
doi: 10.1098/rspa.2009.0126.
* 量子尺度下的時空可能有碎形特性
沒有留言:
張貼留言