分类目录归档:运维

SRE-Golden signals-黄金指标


  • Latency
  • Errors
  • Traffic
  • Satoration

Site Reliability Engineering(SRE)使用一组关键性能指标,被称为“Golden Signals”(黄金信号),用于监控和评估系统的健康状况和性能。这些信号帮助SRE团队主动检测、调查和解决生产环境中的问题。主要的四个Golden Signals如下:

  1. 延迟(Latency):
  2. 定义: 请求从接收到处理完成并返回响应的时间。
  3. 重要性: 延迟对用户体验至关重要。监控延迟有助于确保服务在可接受的时间内响应,避免延迟可能对用户造成的负面影响。

  4. 错误率(Error Rate):

  5. 定义: ...

Read more

VSM-价值流管理


价值流管理(Value Stream Management,简称VSM)是一种优化和可视化交付价值全过程的方法和一系列实践。它涉及到从创意生成到产品或服务交付的整个价值流程的映射、分析和改进。其目标是增强开发和交付团队之间的协作、效率和整体性能。

价值流管理的关键组成部分和原则包括:

  1. 价值流程映射: 这是一种将交付产品或服务的所有步骤和活动进行可视化映射的实践。价值流映射有助于识别低效、瓶颈和改进的机会。

  2. 端到端可见性: 价值流管理强调清晰了解整个价值流的重要性。这涉及跟踪和可视化工作的流动,从最初的概念,通过开发、测试、部署,最终到客户。

  3. 持续改进: 价值流管理与持续改进的...

Read more

Iac-基础设施即代码


"IaC" 是基础设施即代码(Infrastructure as Code)的缩写。这是一种软件工程实践,它将基础设施的定义和管理抽象成代码的形式。IaC 允许开发团队使用编程语言或声明性语言描述和配置基础设施,将其存储在版本控制系统中,并通过自动化工具来部署和管理整个基础设施。

IaC 的主要优势包括:

  1. 可重复性和一致性: 通过代码描述基础设施,可以确保在不同环境和阶段中重复部署的一致性。这减少了人为错误,提高了系统的稳定性。

  2. 版本控制: IaC 允许基础设施的定义被纳入版本控制系统,就像应用程序代码一样。这使得可以轻松地跟踪和回滚基础设施的变化,以及协同开发和测试。

  3. 自动...

Read more

DevOps成熟度模型


DevOps成熟度模型是一种用于评估组织在DevOps实践上的成熟度的框架。这些模型通常提供了一组阶段或层次,帮助组织了解它们在DevOps实践中的位置,并为进一步改进提供指导。不同的模型可能存在一些差异,以下是一些常见的DevOps成熟度模型:

1. Gartner的DevOps 成熟度模型:

  • 阶段:
    • 阶段一 - 散乱的团队: 小规模的DevOps实践,但通常是独立的、非系统性的。
    • 阶段二 - 系统化: DevOps实践在整个组织中变得系统化,形成了一些标准和流程。
    • 阶段三 - 企业标准: 全组织范围内实现了一致的DevOps标准和流程,加强了协同工作。
    • 阶段四 - 基础设施即代码:...

Read more

部署方案


部署方案是指将软件、应用程序或系统从开发环境成功地转移到生产环境的计划和步骤。一个有效的部署方案应该确保在部署过程中保持系统的稳定性、可用性,并且能够方便地进行维护和升级。以下是一些通用的部署方案步骤和考虑事项:

1. 环境准备:

  • 生产环境配置: 确保生产环境的硬件、网络、数据库等基础设施已经配置并满足系统需求。
  • 安全性设置: 配置合适的安全措施,例如防火墙、反病毒软件、身份验证等。

2. 版本控制和构建:

  • 版本控制: 确保使用版本控制系统(如Git)管理应用程序的代码。
  • 构建过程: 设置自动化的构建过程,确保从源代码生成可执行文件或部署包。

3. 数据库迁移:

  • 备份数据库: ...

Read more

运维面试问题集


  • 自我介绍
  • 处理过哪些故障,怎么处理,印象最深的地方
  • k8s 如何管理集群
  • k8s 架构组件
  • 对运维与测试的角色理解

  • k8s 网络中不在同一个节点的两个pod如和通信的

  • 节点亲和性 反亲和性
  • shell 脚本 文本处理
  • 数据库 备份 恢复 命令
  • 配置管理中如何保证多套环境 变更一致性 *

Read more

系统与软件工程 开发运维一体化 能力成熟度模型


标准号:GB/T 42560-2023

  • 项目管理
  • 估算与计划 ESP
  • 监控与调整 MC
  • 风险与机会管理 ROM
  • 供方管理 SM
  • 过程改进
  • 组织治理 GOV
  • 过程改进基础设施 PII
  • 过程资产管理 PAM
  • 过程管理 PROM
  • 效能管理 PERM
  • 组织级培训 OT
  • 支持与保障
  • 度量和分析 MA
  • 根因分析和解决 CAR
  • 配置管理 CM
  • 安全管理 SEC
  • 决策分析和解决 DAR
  • 过程质量保障 PQA
  • 产品研发
  • 产品规划 PDP
  • 需求工程 RQE
  • 架构与设计 AD
  • 实现 IMP
  • 构建与集成 BI
  • 测试 TE
  • 持续集成与持续交付 CICD
  • 服务管理
  • 战略服务规划 SSP
  • 服务交付 SD
  • 服务监控...

Read more