🟢【已修复】交付队列恢复执行及故障复盘报告

当前状态: 交付队列已重新启动,积压订单正在有序开通中。

故障原因说明: 我们注意到部分用户遭遇了交付延迟,经排查,系 WHMCS 分配逻辑与我们的交付队列冲突所致:

逻辑冲突:WHMCS 的 "First Available"(优先可用)策略仅在服务“完全交付”后才会更新节点负载计数。

队列堆积:由于开售前 10 分钟流量过大,我们暂停交付队列约 30 分钟以缓解拥堵。

单点过载:在此期间,WHMCS 错误地判断宿主机(Hypervisor)的负载状态,将该时段内所有订单全部分配至同一节点。
恢复交付后,由于数千台VM同时创建,单台节点瞬间负载导致该节点触发 OOM(内存溢出)保护并停机。

修复措施:
✅ 负载分散:已将受影响的实例重新分散至不同节点,平衡负载。
✅ 逻辑修正:已修补 WHMCS 调度逻辑,现在订单在实际交付执行时会重新进行节点选择,而非下单时锁定。

现在又可以继续冲了,需要下单的可以访问https://www.nodeseek.com/post-552847-1