继阿里云、滴滴之后,今晚腾讯视频又崩了...

发布时间 :2023-12-03 22:08:07
继阿里云、滴滴之后,今晚腾讯视频又崩了,这些互联网大厂往年总吹自己安全可靠,可他们的技术光环在2023年年末好像集体失效了。我认为这些平台事故并不是独立事件,其背后有一定行业背景,总结起来无非就是八个字:开猿节流,降本增笑。
腾讯视频还好一些,崩溃之后不大一会儿就又把服务给拉起来了,这些平台事故里面以滴滴最为离谱,他们团队焦头烂额足足花了12个小时才重新又把服务给拉起来,确实有点草台班子内味儿。有人传滴滴崩溃是因为K8s升错版本,导致所有pod和节点同时被杀无法回滚,我一开始真的不敢相信。
按理说像滴滴这种体量的企业怎么可能机房里只放一个集群?再不济也得有一个备用集群吧?在缺少备用补救的情况之下升版本真就敢往主集群上硬怼吗?而且据我了解很多企业冲K8s真就是流于形式,pod换机必挂,平时写得那些惨不忍睹的配置全部作废,这个时候再想拉服务那真是得全靠使笨劲儿,十几个小时能救回来已经可以说是烧高香了。
对于滴滴这种大型服务平台来讲,技术人员把核心链路和非核心链路区分开来,搞清楚各个链路跑着哪些服务,做到即使非核心链路服务挂掉也不能影响主流程,这都应该是常规操作。如果这种基础工作不做好,万一出故障在生死时刻根本就抓不出关键请求,只能大海捞针把所有服务全部捞起来才能救起主流程。
最关键的是这年头各个互联网大厂裁员的消息我们已经屡见不鲜了,三裁两裁到底裁出去多少一线正儿八经干活的,留下来的人又有多少真正懂业务的,新招进来的员工能否完成技术交接,这全部都是变数。我说句实在的,大厂裁出去的那些人肯定有不少是基层技术,真碰到P0级事故还真得靠那些熟悉业务结构的基层老员工救场。你把人家裁了,出事儿之后再给他们打电话请教,你猜人家还理不理你?要是我那肯定直接摆烂,犯不着为了裁员前司再徒费心血。
其实这些大厂大平台还算有技术兜底的,小厂小平台那就更搞笑了。王自如之前创办的ZEALER大家都知道吧?这个平台从11月28日深夜崩到现在都没救过来,你敢信吗?
不知道未来这种互联网平台的崩坏会不会成为新常态,不知道各大厂以后还会不会继续倡导“开猿节流,降本增笑”,不敢想……
魔金石科技

热门评论

魔金石科技
魔金石科技

开猿节流,降本增笑。

孙大圣是只喵
孙大圣是只喵

那些大厂不会因为这事就反思裁员的,因为他们发现各家都那德性都崩,崩完老百姓继续用,因为没几个可选项,影视剧独播更是做到极致,他们不在乎的,肯定继续裁

偷懒想出来的昵称
偷懒想出来的昵称

前公司打电话说让处理,那肯定还是要处理,一个小时一万可以吧[doge]

杨大壮thinnnnnn
杨大壮thinnnnnn

不吃大饼,得先给钱[doge]

强强312002
强强312002

的图6

今日热门