SRE 的工作介绍
SRE 到底是什么?这是一个最早由 Google 提出的概念,就是用软件解决运维问题。标准化,自动化,可扩展,高可用是主要的工作内容。这个岗位被提出的时候,想解决的问题是打破开发人员想要快速迭代,与运维人员想要保持稳定,拒绝频繁更新之间的矛盾。
#SRE.运维#自动化2022-09-270 浏览流水线:如何做到应用分钟级上线交付?
在云原生领域,我们可以通过容器化的解决方案来排除操作系统层面的繁杂操作,从而让我们直接面对应用本身。但为了更好的理解应用上线的整个过程,以及通过自动化手段所能达到的极限交付,我们本次将基于传统的vsphere超融合方案进行介绍。
#新应用上线#新系统上线#上线交付2022-09-270 浏览什么是云原生?
云就是云计算,那云原生就是在云计算的基础之上设计实现,充分利用云的弹性、分布式等特性,让应用能够实现弹性伸缩、动态调度,也能更高的提升资源利用率。本文从云原生的发展历程、核心理念、代表技术等方面介绍了云原生。
#云生态#云计算2022-09-270 浏览可视化全链路日志追踪
可观测性作为系统高可用的重要保障,已经成为系统建设中不可或缺的一环。本文介绍了可视化全链路日志追踪的新方案,它以业务链路为载体,通过有效组织业务每次执行的日志,实现了执行现场的可视化还原,支持问题的高效定位。
#可视化#全链路日志#可视化全链路日志2022-09-270 浏览B站在全链路压测上的实践
过去的几年里,阿里、美团、字节等大厂均有一系列的实践技术文章进行分享公开,更有PTS全链路压测、XSea全链路压测平台、Takin全链路压测平台等商业化解决方案。站在巨人们的肩膀上,本文将基于这些成熟的实践经验并结合 B 站的基础设施来介绍我们在全链路压测的建设和落地经验。
#全链路压测2022-09-270 浏览Kafka在美团数据平台的实践
Kafka在美团数据平台承担着统一的数据缓存和分发的角色,随着数据量的增长,集群规模的扩大,Kafka面临的挑战也愈发严峻。本文分享了美团Kafka面临的实际挑战,以及美团针对性的一些优化工作,希望能给从事相关开发工作的同学带来帮助或启发。
#数据缓存#数据分发2022-09-270 浏览谈一谈企业级弹性伸缩与优化建设
如何打造我们的弹性伸缩能力、又如何利用弹性的能力解决高昂的成本问题?本文根据笔者过去的实践和思考, 简单阐述对计算资源弹性、容器云kubernetes[1]弹性、混合云弹性、Serverless[2]等的一些心得体会。
#弹性伸缩#计算资源弹性#混合云弹性#容器云集群弹性2022-09-270 浏览字节跳动大规模 K8s 集群管理实践
截至 2021 年底,字节跳动已经建设了完善的云原生基础设施:拥有 200 多个生产集群,共计 50 万节点,容器数超过 1000 万;拥有 10 万多在线微服务,平均每日变更数达 2 万次,离线任务数超过 1.4 亿。
#集群管理#集群管理实践2022-09-270 浏览
- 1