素数定理指出,在前N个整数中,其中大约有1/logN的整数为素数。而且,随着数字变大,素数会越来越稀少,但是减少的速度很慢。与10位的随机数相比,20位的随机数是素数的概率要小一半。
人们自然会猜想:某个类型的数字越常见,该类型数字的间距就越小。在看到一个偶数之后,再向前不超过两个数字就会看到下一个偶数。事实上,偶数之间的距离总是正好等于2。而2的幂数则有所不同,相邻两个2的幂数之间的距离呈指数级增长,在沿着该数列向前时,彼此间的距离只会越来越大,而绝不会变小。例如,在16之后,两个2的幂数之间的距离再也不会小于或等于15。
这两种情况都易于理解,但是相邻素数之间的距离问题理解起来则难得多,即使在张益唐取得突破之后,仍有很多问题没有解决。
不过,由于我们可以把素数看成随机数,这个视角对我们有显著的帮助,因此我们知道会得到什么样的结果。这个视角之所以有用,原因在于这是一个大错特错的视角。素数并不是随机数,素数的所有特点都不是我们可以随意判定的,也不是碰巧如此。但是,实际情况恰好相反:我们认为素数是宇宙的某个无法改变的特征,然后把它刻录成金唱片向星际空间播放,向外星人证明我们不是傻瓜。
素数不是随机数,但从很多方面看它们似乎就是随机数。例如,我们用3除一个随机整数,余数是0、1或者2,而且三种情况出现的频次完全相同。如果用3除一个大的素数,不可能正好除尽,否则,这个所谓的素数如果可以被3整除,就说明它根本不是素数。但是,狄利克雷(Dirichlet)提出的一个古老定理认为,余数1与余数2出现的概率相同,这正好是随机数的一个特点。从“被3除的余数”这个角度看,素数很像随机数。
那么,相邻素数之间的距离呢?我们也许会认为,随着数字变大,素数越来越稀少,它们彼此之间的距离也会越来越大。平均地看,情况的确如此。但是,张益唐的证明表明,彼此间的距离不超过7000万的素数对是无穷的。换言之,相邻素数之间的距离在7000万以内的有无穷多例。这就是“有界距离”猜想。
为什么是7000万呢?因为这是张益唐能够证明的极限数字。事实上,他的论文发表之后,引发了一个研究热潮,世界各地的数学家都加入了“博学者计划”——一种狂热的在线数学基布兹(kibbutz)[4],协同合作,希望在张益唐的研究基础之上,进一步缩小这个有界距离。2013年7月,一个合作团体证明,彼此间的距离不大于5414的素数对有无穷多个。11月,刚刚在蒙特利尔大学拿到博士学位的詹姆斯·梅纳德(James Maynard)将这个距离缩小到了600。“博学者计划”迅速将梅纳德的敏锐发现与其他计划参与者的理解加以归纳。在大家看到本书时,这个距离肯定又缩小了。
乍一看,有界距离似乎是一个神奇的现象。如果素数的距离有越来越大的趋势,那么,为什么有那么多对彼此相近的素数呢?素数之间存在某种引力吗?
当然不是这么回事儿。如果我们让数字随意分布,很有可能某些数字两两之间的位置正好非常接近,就像平面上随机分布的点会形成明显的组群一样。
如果素数具有随机数的特点,不难估计我们将准确地观察到张益唐的研究结果,而且我们还有可能观察到很多素数对的相互距离只有2,如3和5、11和13。这样的素数对就是“孪生素数”,但它们的无穷性还是一种推测,有待进一步证明。
(下文是一个简短的计算过程。如果你们看不懂,可以直接从“孪生素数的数量如此庞大……”那一段往下看。)
别忘了,素数定理告诉我们,在前N个数字当中,有N/logN个数字是素数。如果这些数字是随机分布的,每个数字n是素数的概率约为1/logN,数字n与n+2同为素数的概率就是1/logN×1/logN=1/logN2。我们有可能观察到多少对距离为2的孪生素数呢?在我们所研究的范围内,大约有N对(n,n+2),每一对数字是孪生素数的概率为(1/logN)2,因此我们有可能发现N/(logN)2对孪生素数。
但是,这里的随机性并不十分纯粹,会产生一些微弱的影响,不过数论学家知道该如何应对。我们需要关注的重点是,n为素数与n+1为素数,并不是相互独立的两个事件。n为素数时,n+2是素数的可能性会加大,因此,如果用1/logN×1/logN来表示两者同时成立的概率,就不完全正确。(一种观点认为:如果n是素数且大于2,那么n必然是奇数,因此n+2也是奇数,于是,n+2是素数的可能性更大。)哈代与他的终生合作伙伴利托伍德(J.E.Littlewood)一起,在考虑到这些依存关系的前提下,完成了一个更完善的预测,认为孪生素数的数量实际上比N/(logN)2大32%。根据这种更准确的估计,我们可以预测小于1024的孪生素数的数量应该为1100000000000左右,而实际数字是1177209242304,两者非常接近。(www.xing528.com)
孪生素数的数量如此庞大,不过,这个情况并没有让数论学家感到意外。这不是因为我们认为素数中隐藏着某种神奇的结构,而是因为我们认为这样的神奇结构并不存在,我们猜测素数是随机分布的。如果孪生素数猜想是错误的,孪生素数的存在就是一个奇迹,因为我们需要某种至今为止仍然不为我们所知的力量将这些素数分开。
我们无须过多了解就会发现,有很多数论方面的著名猜想都是这种情况。哥德巴赫猜想就是一个例子,它认为所有大于2的偶数都是两个素数的和。如果素数表现得像随机数,哥德巴赫猜想就必然是正确的。认为存在任意长的素数等差数列的猜想也同样如此,本·格林(Ben Green)与陶哲轩(Terry Tao)完成了该猜想的证明,陶哲轩还因此获得了2004年的菲尔兹奖。
其中最有名的是费马于1637年提出的猜想,该猜想断言方程式An+Bn=Cn在A、B、C、n为正整数且n大于2时无解。(如果n等于2,该方程式会有很多根,例如:32+42=52。)
当时,大家都坚信费马猜想是正确的,就像我们现在相信孪生素数猜想一样。但是,没有人知道如何证明费马猜想,一直到20世纪90年代,普林斯顿大学的数学家安德鲁·怀尔斯才取得了突破。我们认为,n次完全幂已经非常稀少了,要在极为稀少的随机数集中找到两个数字,使两者的n次幂和等于第三个数字的n次幂,这样的可能性更是接近于零。大多数人甚至认为,广义的费马方程式Ap+Bq=Cr在指数p、q与r足够大时也是无解的。如果在p、q、r都大于3且A、B、C没有相同质因数(素因数)的条件下,有人能证明上述方程无解,达拉斯的一位名叫安德鲁·比尔(Andrew Beal)的银行家就会奖励这个人100万美元。我完全相信这个命题是真的,我的理由是:如果完全幂是随机数,这个命题就应该是真命题。但是我认为,要想完成这个命题的证明,我们还必须了解关于数字的一些全新发现。我与多名合作者一起,花了好几年的时间,证明在p=4、q=2、r>4的条件下广义的费马方程式无解。为了解决这个问题,我们专门设计了一些新方法。很显然,仅凭这些并不足以完成这个价值百万美元的任务。
尽管有界距离猜想看上去非常简单,但是张益唐的证明却需要运用现代数学的一些非常深奥的定理。张益唐在前辈的研究基础上完成了他的证明:用我们前面提到的第一种方法,即考察多个素数除以3所得余数的情况,可以看出素数具有随机数的特征。他证明了素数的随机性具有完全不同的意义,与相互间距离的大小有某种关系。随机数就是随机数!
张益唐的成功,以及当代其他数学家(比如本·格林与陶哲轩)所完成的相关研究,都表明我们最终会建立内容更丰富的随机理论,这样的前景甚至比任何单个的研究成果更加令人兴奋。比如,在我们认为数字表现出杂乱无序的随机性分布特征时,我们有某种方法精确地定义这个说法,尽管这种方法的根源是一些实实在在的数论程序。帮助我们彻底揭开素数所有秘密的有可能是一些新的数学理念,而这些理念又赋予了杂乱无序这个概念新的内涵,这样的前景似乎自相矛盾,却又令人无比陶醉!
【注释】
[1]有的人坚持应对这种方法加以区分:如果得出自相矛盾的结果,该证明方法就是反证法;如果仅仅得出错误的结果,这种证明方法就是“拒取式论证法”(modus tollens)。
[2]根据有效的经验法则,你可以推断出,在样本中寻找白化病人时,每名实验对象可以贡献1/20000的可能性,因此50名对象总的贡献为1/400。这种算法不完全正确,但是在结果非常接近于零(例如本例)的情况下,它通常足够精准。
[3]读到这里大家就能看懂logN的真正定义了。所谓对数,就是使ex=N等式成立的数字x。这里,e是欧拉数,它的值约等于2.71828……。这里我使用了“e”,而不是“10”,因为我们准备讨论的对数是自然对数,而不是常用对数(即以10为底的对数)。如果你是一位数学专业人士,或者你有e手指,你就会经常使用自然对数。
[4]基布兹是希伯来语“团体”的意思。——译者注
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。