转自:http://blog.csdn.net/u010807846/article/details/51088750
轮盘赌长这个样子,每个格子的概率是1/37,我们需要用到的模型如右边这个图,即每个有颜色格子的概率是不同的,整体概率为1。
image
先撇开遗传算法,觉得上来讲染色体群体的选择 有点不地道。通俗的讲一下我对轮盘赌算法的理解。
右上边饼图不同颜色的区域,面积大小对应着不同的概率,面积越大,代表概率越 大。假想把这张图打印到一张纸上,随机扔一把小米,落在3区域的小米相对来说数量最多。好了,现在我一粒一粒的扔,扔了10粒米(意味着只选了10个样本),假如5个落在3区域,3个落在1区域,1个落在4区域,1个落在5区域。
image
在应用中,比方说,7号米粒利用概率38%(因为落在了3号区域),8号米粒利用概率14%,9号米粒利用概率38%,10号米粒利用概率31%。
这样有什么好处?避免了所有的米粒都选择概率最大的区域3(所谓的最优值问题),换句话,各个概率(各种情况)都相应的被使用到了,避免了陷入局部最优的问题。
问题又来了,实际编程中该怎么用?往下看。
image
把概率整合到一条线上,然后随机产生数据a,a属于[0,1],比方说
image
image
这样,不同的数据对应不同的数据概率,并且整体上还保留了“区域概率越大,对应数据越多”这一分布!
附上代码吧,c语言写的
#include<math.h>
#include<stdio.h>
#include<stdlib.h>
float generate_random()
{
//randomly generate number between [0,1]
float rand_num = 0.0;
rand_num = (float)rand()/RAND_MAX;
//printf("%f\n", rand_num);
return rand_num;
}
float *generate_probability_band(float *prob_arr, int length)
{
//产生概率带
//传入参数是在main函数中指定的概率分布
//传出参数就是概率带(积累概率)
//计算累计概率,保存在sum_array数组中,用malloc写了一下。
printf("一共有%d个概率数据\n",length);
float *sum_array = NULL;
float *sum_array_tmp = NULL;
sum_array = (float *)malloc((length+1)*sizeof(float));//多一个是为了保存概率带最左边那个0
sum_array_tmp = sum_array;
int i = 0;
float sum = 0.0;
sum_array[0] = 0.0;
for(i;i<length;i++)
{
sum = sum + prob_arr[i];
printf("sum=%f\n",sum);
sum_array++;//先执行++,目的是把概率带最左边那个0保存在sum_array[0]上
*sum_array = sum;
//printf("%x-->%f\n", sum_array,*sum_array);
}
//sum_array = sum_array_tmp;
return sum_array_tmp;
//free(sum_array);
}
//判断随机数位于概率带的哪个位置
int *judge_random_location(float *sum_array, int length)
{
int i = 0;
int j = 0;
float rand_num=0;
int *count=NULL;
count = (int *)malloc((length-1)*sizeof(int)); //count数组用来统计 落在某个概率上的数量
for(i=0;i<length-1;i++)
{
//初始化为0
count[i] = 0;
}
for(i=0;i<length;i++)
{
printf("sum_array[%d] = %f\n", i, sum_array[i]);
}
for(j=0;j<1000;j++) //产生1000个随机数
{
rand_num = generate_random();
if(rand_num>0 && rand_num<1)
{
for(i=0;i<length;i++)
{
if(rand_num>sum_array[i] && rand_num<=sum_array[i+1])
{
//对应的概率带 计数器加1
count[i] = count[i]+1;
}
}
}
}
return count;
}
void main()
{
int i=0;
//probability array
float prob_arr[] = {0.1, 0.2, 0.3, 0.4}; //按照概率1:2:3:4
int length = sizeof(prob_arr)/sizeof(prob_arr[0]);
float *sum_array = NULL;
int *count=NULL;
sum_array = generate_probability_band(prob_arr, length);
count = judge_random_location(sum_array, length+1);
for(i=0;i<length;i++)
{
printf("%d:", count[i]);
if(i == (length-1))
printf("\b");
}
printf("\n");
system("pause");
}