这篇文章主要针对serverless function的resource provisioning进行设计。 把over-provisioned的function资源分配给under-provisioned的function。
论文结构比较简单,挑战
- 变化的workload
- 搜索空间大
- over-provisioned的function被harvest后可能会造成性能下降
对策
- event-driven:来一个request执行一次
- 用一个score network来计算得分
- 设计了一个safe-guard,让资源能够在历史峰值之上,并且能及时召回资源
一些细节问题
- 用的RL
- slowdown应该是用的一个比例,分母是第一次的response latency
- 指标用了
- available cpu、available memory、inflight requests num
- avg cpu peak、avg mem peak、avg interval、avg execution time、baseline
- 很多细节写的不是太清楚,也没开源