跳转至内容
上海创厦网络科技
IT服务专家
上海创厦网络科技上海创厦网络科技
  • 首页
  • 网站建设
  • IT服务
  • 平面设计
  • 网络工程
  • 首页
  • 网站建设
  • IT服务
  • 平面设计
  • 网络工程

优化定时任务调度框架的实现

您在这里:
  1. 首页
  2. Linux技巧
  3. 优化定时任…
5月262022
Linux技巧


导读 本文介绍了作者优化定时任务调度框架的实现。一起来来看看吧。

项目中需要使用一个简单的定时任务调度的框架,最初直接从GitHub上搜了一个star比较多的,就是https://github.com/robfig/cron,目前有8000+ star。刚开始使用的时候发现问题不大,但是随着单机需要定时调度的任务越来越多,高峰期差不多接近500QPS,随着业务的推广使用,可以预期增长还会比较快,但是已经遇到CPU使用率偏高的问题,通过pprof分析,很多都是在做排序,看了下这个项目的代码,整体执行的过程大概如下:

对所有任务进行排序,按照下次执行时间进行排序
选择数组中第一个任务,计算下次执行时间减去当前时间得到时间t,然后sleep t
然后从数组第一个元素开始遍历任务,如果此任务需要调度的时间 < now,那么就执行此任务,执行之后重新计算这个任务的next执行时间 每次待执行的任务执行完毕之后,都会重新对这个数组进行排序 然后再循环从排好序的数组中找到第一个需要执行的任务去执行。 代码如下: for { // Determine the next entry to run. sort.Sort(byTime(c.entries)) var timer *time.Timer if len(c.entries) == 0 || c.entries[0].Next.IsZero() { // If there are no entries yet, just sleep - it still handles new entries // and stop requests. timer = time.NewTimer(100000 * time.Hour) } else { timer = time.NewTimer(c.entries[0].Next.Sub(now)) } for { select { case now = <-timer.C: now = now.In(c.location) c.logger.Info("wake", "now", now) // Run every entry whose next time was less than now for _, e := range c.entries { if e.Next.After(now) || e.Next.IsZero() { break } c.startJob(e.WrappedJob) e.Prev = e.Next e.Next = e.Schedule.Next(now) c.logger.Info("run", "now", now, "entry", e.ID, "next", e.Next) } case newEntry := <-c.add: timer.Stop() now = c.now() newEntry.Next = newEntry.Schedule.Next(now) c.entries = append(c.entries, newEntry) c.logger.Info("added", "now", now, "entry", newEntry.ID, "next", newEntry.Next) case replyChan := <-c.snapshot: replyChan <- c.entrySnapshot() continue case <-c.stop: timer.Stop() c.logger.Info("stop") return case id := <-c.remove: timer.Stop() now = c.now() c.removeEntry(id) c.logger.Info("removed", "entry", id) } break } } 问题就显而易见了,执行一个任务(或几个任务)都重新计算next执行时间,重新排序,最坏情况就是每次执行1个任务,排序一遍,那么执行k个任务需要的时间的时间复杂度就是O(k*nlogn),这无疑是非常低效的。 于是想着怎么优化一下这个框架,不难想到每次找最先需要执行的任务就是从一堆任务中找schedule_time最小的那一个(设schedule_time是任务的执行时间),那么比较容易想到的思路就是使用最小堆: 在初始化任务列表的时候就直接构建一个最小堆 每次执行查看peek元素是否需要执行 需要执行就pop堆顶元素,计算next执行时间,重新push入堆 不需要执行就break到外层循环取堆顶元素,计算next_time-now() = need_sleep_time,然后select 睡眠、add、remove等操作。 我修改为min-heap的方式之后,每次添加任务的时候通过堆的属性进行up和down调整,每次添加任务时间复杂度O(logn),执行k个任务时间复杂度是O(klogn)。经过验证线上CPU使用降低4~5倍。CPU从50%左右降低至10%左右。 优化后的代码如下,只是其中一部分。 全部的代码也已经在github上已经创建了一个Fork的仓库并推送上去了,全部单测Case也都PASS。感兴趣可以点过去看。https://github.com/tovenja/cro for { // Determine the next entry to run. // Use min-heap no need sort anymore // 这里不再需要排序了,因为add的时候直接进行堆调整 //sort.Sort(byTime(c.entries)) var timer *time.Timer if len(c.entries) == 0 || c.entries[0].Next.IsZero() { // If there are no entries yet, just sleep - it still handles new entries // and stop requests. timer = time.NewTimer(100000 * time.Hour) } else { timer = time.NewTimer(c.entries[0].Next.Sub(now)) //fmt.Printf(" %v, %+vn", c.entries[0].Next.Sub(now), c.entries[0].ID) } for { select { case now = <-timer.C: now = now.In(c.location) c.logger.Info("wake", "now", now) // Run every entry whose next time was less than now for { e := c.entries.Peek() if e.Next.After(now) || e.Next.IsZero() { break } e = heap.Pop(&c.entries).(*Entry) c.startJob(e.WrappedJob) e.Prev = e.Next e.Next = e.Schedule.Next(now) heap.Push(&c.entries, e) c.logger.Info("run", "now", now, "entry", e.ID, "next", e.Next) } case newEntry := <-c.add: timer.Stop() now = c.now() newEntry.Next = newEntry.Schedule.Next(now) heap.Push(&c.entries, newEntry) c.logger.Info("added", "now", now, "entry", newEntry.ID, "next", newEntry.Next) case replyChan := <-c.snapshot: replyChan <- c.entrySnapshot() continue case <-c.stop: timer.Stop() c.logger.Info("stop") return case id := <-c.remove: timer.Stop() now = c.now() c.removeEntry(id) c.logger.Info("removed", "entry", id) } break } } 原文来自:https://os.51cto.com/article/705679.html 本文地址:https://www.linuxprobe.com/cron-grub.html 编辑:roc_guo,审核员:逄增宝 Linux命令大全:https://www.linuxcool.com/ Linux系统大全:https://www.linuxdown.com/ 红帽认证RHCE考试心得:https://www.rhce.net/ 为您推荐一些与本文相关的文章: 能造空调却做不出“中国好笔” 董明珠首次回应“圆珠笔赌约” linux解决“/bin/bash^M: bad interpreter“的思路 捷讯:赵效营9月3日上海顺利通过RHCE认证。 为什么Wireshark无法解密HTTPS数据 《主板维修精华秘籍》pdf电子书免费下载 Wine 3.0 RC3 候选版已发布 一些程序员用于实践的方法的讨论 《TensorFlow技术解析与实战.李嘉璇》pdf电子书免费下载 UBports发布Ubuntu Touch OTA-4 美法院判决冻结贾跃亭所持FF股份

Category: Linux技巧startupplaza2022年5月26日评论

作者: startupplaza

文章导航

历史的文章历史的文章:Linux 根分区快满了,这个方法快速定位!未来的文章未来的文章:ASP.NET Web Forms – ArrayList 对象简介

Related Posts

Linux中如何禁止普通用户使用su命令
2022年5月26日
简单介绍SpringSecurity框架简介及与shiro特点对比
2022年5月26日
Ubuntu 20.04 使用realmd加入AD域
2022年5月26日
简单介绍vscode调试container中的程序的方法步骤
2022年5月26日
单点登录之cas集成sonar的配置方法详解
2022年5月26日
简单介绍Rust中的workspace
2022年5月26日

技术探讨

  • 使用HTML5捕捉音频与视频信息概述及实例
  • HTML5 Canvas实现玫瑰曲线和心形图案的代码实例
  • 详解HTML5中的