搬:判断一个数是否为质数素数——从普通判断算法到高效判断算法思路

    xiaoxiao2023-10-26  36

    判断一个数是否为质数/素数——从普通判断算法到高效判断算法思路

    2016年05月06日 15:00:14 huang_miao_xin 阅读数:90527

    判断一个数是否为质数/素数——从普通判断算法到高效判断算法思路

    定义:约数只有1和本身的整数称为质数,或称素数。 计算机或者相关专业,基本上大一新生开始学编程都会接触的一个问题就是判断质数,下面分享几个判断方法,从普通到高效。

    1)直观判断法

    最直观的方法,根据定义,因为质数除了1和本身之外没有其他约数,所以判断n是否为质数,根据定义直接判断从2到n-1是否存在n的约数即可。C++代码如下:

     

     

    bool isPrime_1( int num )

    {

    int tmp =num- 1;

    for(int i= 2;i <=tmp; i++)

    if(num %i== 0)

    return 0 ;

    return 1 ;

    }

     

    2)直观判断法改进

    上述判断方法,明显存在效率极低的问题。对于每个数n,其实并不需要从2判断到n-1,我们知道,一个数若可以进行因数分解,那么分解时得到的两个数一定是一个小于等于sqrt(n),一个大于等于sqrt(n),据此,上述代码中并不需要遍历到n-1,遍历到sqrt(n)即可,因为若sqrt(n)左侧找不到约数,那么右侧也一定找不到约数。C++代码如下:

     

    bool isPrime_2( int num )

    {

    int tmp =sqrt( num);

    for(int i= 2;i <=tmp; i++)

    if(num %i== 0)

    return 0 ;

    return 1 ;

    }

    3)另一种方法

    方法(2)应该是最常见的判断算法了,时间复杂度O(sqrt(n)),速度上比方法(1)的O(n)快得多。最近在网上偶然看到另一种更高效的方法,暂且称为方法(3)吧,由于找不到原始的出处,这里就不贴出链接了,如果有原创者看到,烦请联系我,必定补上版权引用。下面讲一下这种更快速的判断方法; 首先看一个关于质数分布的规律:大于等于5的质数一定和6的倍数相邻。例如5和7,11和13,17和19等等;

    证明:令x≥1,将大于等于5的自然数表示如下:

    ······ 6x-1,6x,6x+1,6x+2,6x+3,6x+4,6x+5,6(x+1),6(x+1)+1 ······

    可以看到,不在6的倍数两侧,即6x两侧的数为6x+2,6x+3,6x+4,由于2(3x+1),3(2x+1),2(3x+2),所以它们一定不是素数,再除去6x本身,显然,素数要出现只可能出现在6x的相邻两侧。这里有个题外话,关于孪生素数,有兴趣的道友可以再另行了解一下,由于与我们主题无关,暂且跳过。这里要注意的一点是,在6的倍数相邻两侧并不是一定就是质数。

    此时判断质数可以6个为单元快进,即将方法(2)循环中i++步长加大为6,加快判断速度,原因是,假如要判定的数为n,则n必定是6x-1或6x+1的形式,对于循环中6i-1,6i,6i+1,6i+2,6i+3,6i+4,其中如果n能被6i,6i+2,6i+4整除,则n至少得是一个偶数,但是6x-1或6x+1的形式明显是一个奇数,故不成立;另外,如果n能被6i+3整除,则n至少能被3整除,但是6x能被3整除,故6x-1或6x+1(即n)不可能被3整除,故不成立。综上,循环中只需要考虑6i-1和6i+1的情况,即循环的步长可以定为6,每次判断循环变量k和k+2的情况即可,理论上讲整体速度应该会是方法(2)的3倍。代码如下:

     

    bool isPrime_3( int num )

    {

    //两个较小数另外处理

    if(num ==2|| num==3 )

    return 1 ;

    //不在6的倍数两侧的一定不是质数

    if(num %6!= 1&&num %6!= 5)

    return 0 ;

    int tmp =sqrt( num);

    //在6的倍数两侧的也可能不是质数

    for(int i= 5;i <=tmp; i+=6 )

    if(num %i== 0||num %(i+ 2)==0 )

    return 0 ;

    //排除所有,剩余的是质数

    return 1 ;

    }

    算法性能测试:

    编写测试代码,使用较多数据测试比较几种方法的判断效率,数据量40w,代码如下:

     

    #include <iostream>

    #include <string>

    #include <ctime>

    #include <vector>

    using namespace std;

    bool isPrime_1( int num );

    bool isPrime_2( int num );

    bool isPrime_3( int num );

    int main()

    {

    int test_num =400000;

    int tstart ,tstop; //分别记录起始和结束时间

    //测试第一个判断质数函数

    tstart=clock ();

    for(int i= 1;i <=test_num; i++)

    isPrime_1(i );

    tstop=clock ();

    cout<<"方法(1)时间(ms):" <<tstop- tstart<<endl ;//ms为单位

    //测试第二个判断质数函数

    tstart=clock ();

    for(int i= 1;i <=test_num; i++)

    isPrime_2(i );

    tstop=clock ();

    cout<<"方法(2)时间(ms):" <<tstop- tstart<<endl ;

    //测试第三个判断质数函数

    tstart=clock ();

    for(int i= 1;i <=test_num; i++)

    isPrime_3(i );

    tstop=clock ();

    cout<<"方法(3)时间(ms):" <<tstop- tstart<<endl ;

    cout<<endl ;

    system("pause" );

    return 0 ;

    }

    运行结果如下;

    可以看出,判断到40w,效率上方法(1)明显要差得多,方法(2)和方法(3)在这种测试数量下时间相差2倍多

     

    单独对比方法(2)和(3),数据量加到1000w,结果如下:

    可以看出,方法(2)和方法(3)在这种测试数量下时间相差依然是2倍多,不过已经是很不错的提升。

    对了,附上运行环境,CPU-i5-3210,内存4G,win7,vs2012。

     

    好了,判断质数的方法暂时就到这里,不足之处欢迎各道友指出。

    最新回复(0)