运维是做什么的
以下是中国互联网行业部分资深运维工程师对运维的看法(涉及隐私,相关名称使用首字母缩写):
CXY:
运维是一个非常宽泛的定义,在不同的公司不同的阶段有不同的责任和定位。把操作的字面意思当成敲几行操作命令的工作是不对的。对于初创企业,运维工程师的工作可能需要从申请域名、购买/租赁服务器、上架、调整网络设备设置、部署操作系统和运行环境、部署代码、设计和部署监控、防止漏洞和攻击等方面入手。对于大公司来说,对运维工作的要求越来越高,也催生了更细致的运维分工。从大方向看,IT可以分为网站运维、系统运维、网络运维、数据库运维、IT运维、运维开发、运维安全等方向。
很多非从业者对运维的看法,一般属于IT运维这种很小的责任。一些R&D工程师对操作和维护的看法仅限于操作和维护的几个方面:部署、变更、监控和响应。
无论什么运维,最基本的职责就是保证业务的稳定运行。所以,一定是业务稳定的主人。有些人通常认为运维工程师就像一个消防员,7*24小时异常反应灭火。不过稳定运维工程师离医生更近。医生也分各个科室和急诊科。他们需要先判断病人的问题,对症下药。
业务有各种需求。如果运维工程师能够满足业务需求,或者积极探索业务的痛点和改进方法,就能为业务实现更多价值。
在满足业务需求时,我们应该优先考虑快速业务发展的非常重要的需求,如稳定性、部署和变更效率以及容量管理。不用说,如果用户不能稳定地使用你的业务,任何产品特性都毫无价值。对于百度这样快速成长的互联网公司来说,每天都需要向用户提供大量的升级。如何尽快满足异地大集群产品的升级需求,同时让用户不知道升级过程,是我们的追求。当用户用百度来衡量网络能否接入互联网时,是对运维质量的一种恭维。
其次,可以横向看不同业务的需求。如果能抽象出多种服务的需求,平台一些常见的工作(比如数据库、cdn、监控、流量访问与调度、大数据的存储与计算),也可以在这个方向上做进一步的发展。像百度这样巨大的流量和服务器规模,你不仅有巨大的空间和挑战,而且有足够的资源和支持来开发和应用行业内最前沿的技术。
经过一定的积累,可以进入宏观和微观层面,从全公司层面(涉及网络、硬件、系统、应用开发方式等关键点)考虑业务的智能部署和调度,进一步提高效率,节约成本。
如果能了解业务,了解业务模式,并与业务紧密结合进行优化创新,是运维工程师体现价值的另一种方式。有很多产品创新、专利申请、发表的论文、改进的业务指标,都是运维工程师直接或合作贡献的。
YBX:
与R&D人员相比,运维工程师可以在全球范围内观察被维护的计算机系统,尤其是高级运维工程师,并且没有模块边界。这个独特的位置带来了33,360英镑的巨大价值
知道系统的精确瓶颈点,进而知道系统的精确容量;知道如何在系统出现瓶颈之前快速提供容量。知道了系统的风险点,我们就可以协调
同样,从公司不同业务的角度出发,可以统一分配资源,从而节约资源。
KZ:
设计和实施能够提高公司服务的可用性、可扩展性、延迟和效率的软件。处理日常紧急情况,纠正和更换有问题的部件。并设计了避免该问题方法。为超大规模分布式系统设计和实现新的架构和标准。参与服务扩展计划,预测服务增长趋势,优化软件和系统性能。提供在线咨询服务和现场问题解决服务。搭建自动化运维平台,解决日常问题。建立知识库,预测可能出现的问题。
XX:
运维是指维护生产环境、与生产环境相关的资源和服务的全过程,包括保证生产环境稳定、高效、低成本运行的相关技术和流程手段。
一方面,运维最终负责业务功能,其价值体现在产品价值最大化。这通常通过最大化产品功能的性能来实现。比如搜索引擎的运营和维护,重点是保证用户在搜索中的终极体验,稳定、快速、准确、新颖、完整。在线聊天系统的运行和维护应确保用户聊天过程的实时性和顺畅性。另一方面,它最终要对网上业务的成本负责。它的价值体现在降低服务的运营成本
运维工作的模式一般取决于被维护业务的特点和要求,形成多个需要进行的学科方向。常见的解决方案包括以下主题:事件管理、配置管理、变更管理、容量管理等。
运维工程师的要求特别严格,因为运维工程师针对的是不同的问题