老版本产生的错误结果,一直存在。新版本上线,已经存在的错误又不会影响新版本运行,能被新版本兼容,所以也没有被检查出来。这种错误该如何避免呢?运维日常巡检、新版本上线时的关键节点检查。例如,用户中心老版本的一个循环,导致redis的key值有500多M,新版本改正这个bug以后,已经存在于redis的大key值没有被删除,仍然一直运行。直到占用带宽过大被发现,才予以解决。