遗传算法实现自动排课

暑期带了几个学生做自动排课系统。系统以高校为假想服务对象,要求安排好一所高校一学期的课表,包括公共必修课、专业必修课、公共选修课、专业选修课。系统要求在满足教室、老师、学生各自不存在冲突、教室资源符合课程需要等基本前提(硬约束)下,尽量满足一系列优化条件,比如:学生的选修课冲突课时数、老师所带的课程是否是他经常带的课程、老师个人的要求,比如星期几不上课等等。

解决这种优化问题,常用的是遗传算法。关于遗传算法,网上有很多介绍。我这里就简述一下这个算法在自动排课系统中的应用。

编码

应用遗传算法解决实际问题,第一步当然是选择一个合理的编码方案。我们希望能够把整个课表表示为一个二进制串,同时,我们也能够把一个二进制串解码成一个课表。

我们以“课程班级”为基准进行编码。所谓“课程班级”就是指某个班上的某个课。比如19级软件工程1班上的《高等数学》,这就是一个“课程班级”的概念。显然,每个课程班级需要分配一个老师、单双周、每周的上课时间与教室,开始上课的周编号。

---- 我们可以给老师10个二进制位,这最多可以表示1024个老师,已经不少了。然而,这样对老师编码是不科学的。比方说,这个学校虽然有1024个老师,但是具体到《高等数学》这门课,可以带的老师数量就非常有限了。对于任一课程,我们都有一个可以带这门课的老师列表,并给这个列表的老师从0开始编号。我估计,这样编码的话,5个二进制位足够了。这种编码的好处是,任意随机生成的老师一定是符合条件的。

---- 有些课程分单双周,有些课程不分。这些应该不需要编码,而是直接从输入文件中提取的。但是,如果区分单双周,我们需要设定究竟是单周还是双周上课。因此我们用1位二进制来表示这个信息。比如0表示单周上课,1表示双周上课。而如果某个课程班级不区分单双周,则解码时无视这个信息

---- 我们假设每个星期上五天课,每天5节大课(每节大课实际上代表2个课时)。这样,每节课的时间用5位二进制来表示

---- 我们可以假设教室也是10个二进制位,这最多可以表示1024个教室,也不少了。然而,与老师的编码一样,这样粗糙地对教室进行编码也是不科学的。任何一门课程都有基本的教学资源需求(比如投影仪、试验设备等等),对于任何一门课程,都有一个可用教室列表,我们按这个列表来编码更科学。其优点是,任意随机生成的教室一定是符合这门课程要求的。这种编码方案下,我们也可以用10个二进制来表示教室,当然具体数值需要根据实际问题而定。

---- 一节大课于是就是15位二进制,前5位代表时间、后面10位代表教室。每个课程班级周学时是固定的。比如每周2个学时的话,就是15位二进制表示每周的课;4个学时的话,就是30位二进制表示每周的课,等等。

---- 绝大多数课程以第一周开始上课,有些课程以春夏学期的夏学期或秋冬学期的冬学期开始上课,区分单双周的课程还可能从第2周或者夏冬学期的第2周开始上课。

这样我们一个课程班级就编码完成了。而把所有的课程班级的基因放在一起就是一个完整的课表。虽然每个课程班级的基因段长短不一,但是,最终整个个体的基因长度是一样的。

有了上面的分析,编码、解码都不是问题了。接下来就是初始化了。

初始化

遗传算法中基因的初始化常常是随机初始化。比如一个课表总长是1000个二进制位,我们随机设定这1000个二进制位(0或1)。这样做可能很多时候这个基因并不满足基本的硬约束要求。这种不合格的个体我们直接予以放弃。我们通常需要随机生成1000个乃至更多个个体,这就是第一代种群。

当然,如果实际问题中,某个资源比较紧张(比如老师数量少,或者教室少,这样极容易出现冲突而不满足基本硬约束),我们这种方案可能要经历比较长的时间才能以随机的方式找到一个合格的个体。极端情况下,资源紧张到理论上只存在一两个可能的合法解,这种情形下就完全不可以使用我们这里的遗传算法方案了。

实际问题中,如果某个资源比较紧张,我们还可以采取一些“改良”的策略。一个基本的策略就是减少资源争夺。比如《高等数学》的老师非常少,那么如果某个老师既可以带《高等数学》也可以带《概率与统计》,那么我们可以限定他只带《高等数学》,以避免资源的争夺。另一种策略是使用其他算法,比如贪心算法,先解决好存在冲突的资源。当然,这种情况下,程序又要复杂很多了。

打分

我们需要对每一个个体进行打分。这个打分通常需要考虑到需求方的要求。比如需求方更倾向于老师带自己熟悉的课,那么我们就需要提高相应分值的权重。打分的要求是每个个体的分值差异不应该太大。比如有些个体1000分,有些个体1分,这样的分值分布非常不合理。我们不希望见到极端大或者极端小的情形。因为我们接下来需要将分值进行归一。

所谓归一,就是说每个个体的最终归一得分就是它的原始得分除以种群所有个体原始得分的总和。这样,最终,所有个体的得分之和是1。

选择、交叉与变异

有了得分之后,我们就可以进行选择。采用轮盘赌的方案来随机选择两个个体。所谓轮盘赌,是指你随机从0到1生成一个数字,遍历个体,每个个体的得分依次相加,总得分第一次大于刚才生成的随机数时,就选择当前这个个体。轮盘赌的选择算法能够确保个体被选中的概率大小由它的得分高低决定,得分越高的个体被选中的概率越大。

我们采用这种方法选择两个不同的个体,然后将个体的基因进行交叉、变异操作,生成两个新的个体,也就是子代。如果子代个体不满足基本约束条件,那么予以放弃。我们用这样的算法生成1000个子代个体。

我们还可以把上一代的最优个体直接放入下一代,确保当前的最优基因不会丢失。这有助于加快算法的收敛。

重复这样的步骤,直到算法不能再产生更优的个体为止。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352