Accelerating Serverless Computing by Harvesting Idle Resources

这篇文章主要针对serverless function的resource provisioning进行设计。 把over-provisioned的function资源分配给under-provisioned的function。

论文结构比较简单,挑战

  1. 变化的workload
  2. 搜索空间大
  3. over-provisioned的function被harvest后可能会造成性能下降

对策

  1. event-driven:来一个request执行一次
  2. 用一个score network来计算得分
  3. 设计了一个safe-guard,让资源能够在历史峰值之上,并且能及时召回资源

一些细节问题

  1. 用的RL
  2. slowdown应该是用的一个比例,分母是第一次的response latency
  3. 指标用了
    1. available cpu、available memory、inflight requests num
    2. avg cpu peak、avg mem peak、avg interval、avg execution time、baseline
  4. 很多细节写的不是太清楚,也没开源