互联网公司的「敏捷开发」流程是怎么样的?每个职位的角色和分工是什么?
55 个回答
分享一个完整的敏捷项目开发流程,以及一个详细的敏捷认知到落地的知识库(文末)。
一、一个故事带你了解敏捷流程
在讲道理之前,我先讲个故事。
最近某公司负责人一直在思考这件事,“冬季如何让更多的人参加户外运动”。然后在某个下雪天,他惊讶的发现路上竟然一个雪人都看不到,这时他灵机一动,“如果现场有一些造型奇特的雪人,会不会让更多人参与户外运动呢”。
于是他回到公司跟核心团队交换了想法,随后经过初步的市场调研和反复的讨论,负责人决定在这一方向上投入一些研发力量进行市场验证。

经过产品研发部门的细化,雪人的实现路径慢慢的清晰起来,
于是负责人决定投入三个敏捷团队来“堆”这个雪人,那为了保障跨团队的协作效率,相关团队有这么几个重要的工作契约:
- 全团队只有一个产品总决策人,每个敏捷团队驻扎一名产品负责人。
- 每两周全团队要同步一次雪人的研发状态和下一步的研发目标(遇紧急问题需及时沟通)。
- 三个敏捷团队有各自的“待办列表”,但总体“需求”来源于大目标。
- 各敏捷团队要有持续交付能力,需定期集成一次,每两周要有一个全局版本。
从全团队的计划会议上, 所有人明确了第一个开发周期的目标:一个戴帽子的雪人(MVP版本)。
那么第一个开发周期的目标确定后,各敏捷团队内部召开了内部计划会议。
团队一采用的是Scrum,他们第一个开发周期的目标是“实现一顶能戴的帽子”;
团队二采用的是看板,他们第一个开发周期的目标是“实现一个个圆圆的头”;
团队三采用的也是Scrum,他们第一个开发周期的目标是“实现一个结识的身体”。
他们约定了各自的对接时间和关键协议,然后在随后的两周时间里,每个团队开始了各自的研发任务。当然除了既定的业务目标,每个团队也把自己第一版的CI/CD搭建了出来(非功能性需求)。
两周后,第一版雪人在预发布环境中亮相,因为内部已经经历了验收和跨部门的联调,所以这次的预发布过程中没有遇到什么大问题。两天后,雪人被投放在指定的地点,根据数据埋点显示,当天现场有很多人围观,引起了不小的轰动,负责运营的团队在现场也收集了很多反馈。
后来负责人召集核心团队对第一版雪人的发布进行复盘,同时对发布后的数据进行了分析,最终负责人决定在这个方向上继续投入,随即负责人召集产品研发部门规划了下一阶段的工作。
第二个开发周期 的目标确定后,各敏捷团队的”待办事项列表“都更新了。这三个敏捷团队根据最新的”待办事项列表“对这个周期的工作进行了规划,然后开始了新一轮的开发,接着第二版雪人如期投放,吸引了更多的人到户外参加现场活动。
之后是第三次迭代、第四次迭代……随着时间的推移,各个敏捷团队的交付能力越来越强。为了最大化的发挥敏捷团队的创造力,负责人做了如下要求:
- 每个新特性必须有独立的测试。
- 每个生产环境的变更必须通过严格的测试测试(在CD中通过单元测试、集成测试、性能测试等)。
- 在不影响其他”雪人部位“、不影响大版本规划的前提下,各个”雪人部位“可以按需部署,用于快速响应游客的诉求、修复雪人的缺陷。
后来雪人在不断的产品迭代中走向正轨……
那这种方式就是典型的互联网公司的「敏捷开发」流程
我总结这个流程就是:

相信通过这个故事你对敏捷开发流程已经有所了解,下面我将结合我们团队的经验,讲述
一个完整敏捷流程闭环是什么样的,典型的敏捷团队是什么样?内部又有什么样的流程的?
,以及我们常使用的辅助工具
PingCode
二、如何打造一个完整敏捷流程闭环
在一个健康的互联网公司中, 一个明智的决策通常要经过充分的调研和评估,然后才能成为各个部门的目标。当然定目标绝不是喊口号 ,它包含两部分的内容:
1. 目标是什么
2. 如何检验我们正在向目标走。
而在这个过程中, 各个关键角色的目标要进行对齐,所有人的步调要保持一致,由下向上及时反馈目标进展。

那对于产品研发部门来说,
产品的研发进度无疑是非常重要的。如果我们对一个产品目标进行分解,会形成一个产品的关键路线图(或者称为用户故事地图),在这个路线图中分布着不同的产品特性和其完成时间。

接着这些”需求“被分级分类后放在各个开发团队的”产品待办列表“中。

进入到一个Scrum团队中,他们在自己的”产品待办列表“中就可以看到按优先级排序的各类需求。

Scrum团队会根据综合因素
(通常包含:优先级、工作量、依赖关系、非功能性需求的比例等等)
安排每个开发周期的工作,他们在每个开发周期结束时都会产出一个可以交付的程序增量。随后我们将所有的Scrum团队完成的服务进行集成,形成一个全局版本,部署到生产环境中。

最后我们再对不同的功能点进行追踪,对各类活动数据进行分析,为后续的决策提供数据支持,这便形成了一个完整的闭环。
这里我之所以把”敏捷开发流程“拉的这么长,是因为今天的敏捷已经不是”团队级别“的概念了。20年前敏捷开发试图解决业务团队与开发团队之间的矛盾,而今天敏捷开发是一种思维方式,这种思维方式将为整个组织进行赋能。

那对于今天雪人的故事而言,整个组织就是在用敏捷的方式响应新的”需求“。如果只有研发部门采用敏捷开发,那今天故事的结局会不一样;
如果只有一个研发团队采用敏捷开发,那故事的结局会更不一样。当然今天雪人的故事中有很多夸张的因素在,很多事情并不是一蹴而就的,基础设施也需要时间来演进。
说到这,我们再回到团队级别的敏捷开发中,毕竟能落地的才是真的。
三、典型的敏捷团队是什么样?内部又有什么样的流程的?
首先,我认为敏捷开发绝不是一种或几种固定的开发框架,虽然我们在实施敏捷开发时确实也离不开这些框架,但敏捷最大的价值是它传达出来的价值观。
其次,我认为使用Scrum和看板这样成熟的框架是十分必要的,标准化的研发流程容易产生规划化效果,说人话就是容易复制。 那么典型的敏捷团队是什么样?内部又有什么样的流程的?
我首推Scrum,放图:

这个团队在开始一个新的Sprint之前,PO会及时更新左侧的产品待办列表,他通常按照优先级进行排序,并对列表里的工作项复杂度有个大概的认知。
在第一周周一的早上10点 ,Scrum Master组织所有人参加计划会议:首先由PO说明这个Sprint的目标,再对待办列表进行讲解。然后由开发团队对用户故事的规模进行预估,在团队容量允许的情况下,将用户故事放入这个Sprint的工作列表中。之后由开发团队对Sprint的工作列表进行承诺。

散会后各自回去主动领任务开始干活,当开发工程师开始一项工作时,他会从主分支checkout出一个特性分支,然后基于这个分支提交新代码,当开发完成时,他会向主分支提交Pull Request(或Merge Request),这会自动触发CI流水线(执行静态检查、单元测试等),CI流水线通过后,需要另一位开发工程师手动Code Review,只有Code Review通过后代码才会合入主分支,这会自动触发CD流水线(执行集成测试、部署测试环境等)。
部署完成后关掉相关的开发任务, 领取下一个开发任务 。

每天早上10点,Scrum Master组织所有人开站立会议,每人花2分钟 同步一下工作进展 。

第二周 周五下午4点左右,Scrum Master组织所有人开评审会议, 由每个任务的负责人演示其完整的工作,由PO确定Sprint目标是否完成,版本什么时候对外发布,新增bug的紧急程度等等 。
第二周周五下午5点左右,Scrum Master组织所有人开回顾会议,每个人说一下 团队做的好的和不好的地方,有哪些改进方案等。

第二周周五晚些时候,最新的版本部署到预发布环境中。
第三周(新Sprint的第一周)周二的晚上,部署最新的版本到生产环境中。
对于自管理能力强,或者周期性不强的团队选择看板,放图:

这个团队非常注意”流动的感觉“,为了保证让工作流动起来,他们定义了5个栏:
需求、设计、开发、测试和部署,其中设计、开发和测试都有明确的“完成的定义”和在制品的限制。
有任何需求给到这个团队的时候,直接在需求列创建一个工作项即可。
当设计同学准备处理下一项任务时,他只需从上一栏中拉过来即可,但是当他想将任务拖到已完成时,这项工作必须满足设计栏的“完成的定义”。
就是说所有的方案必须通过评审,并且将影响方案告知相关方。当他不把这个任务拖到已完成的时候,那么下游的开发同学不会继续处理这个任务,这项任务将一直卡在”设计正在做“这一栏里。
当开发同学准备处理下一项任务时,他只需从上一栏的已完成中拉过来即可,当他要完成一项任务时,要提交相应的代码,覆盖单元测试并通过CI,然后再通过CD部署到Test环境中。
当测试同学准备处理下一件工作时,他只需从上一栏的已完成中拉过来即可,为这个任务写相关的自动化测试并执行通过,然后再把任务拖到已完成中。
最后由部署同学拖动任务到部署栏中,部署这个最新的版本。
他们每天早上都会看着看板开早会,说一下当前的工作进展。 在这个过程中,如果有一项工作长期被卡在某一栏中,将很容易被发现,如果有大量的工作被卡在某一栏时,这时将暴露出这个团队最大的瓶颈问题。这样的方式让他们的工作状态一目了然。

类似这样的Scrum和看板团队组成了一个大型的研发部门,这个部门有自己的季度目标,每个月至少会开会一次部门同步会,他们会同步所有项目的工作进展和下一步的工作计划,就像雪人的故事一样……
敏捷开发的流程就是这样的, PingCode 提供的标准化研发流程也是这样的。
在这里我强烈推荐大家来体验一下。
附上链接: PingCode
文/孙敬云(个人公众号同)
推荐阅读:
敏捷开发系列内容 : Scrum 是什么?一文读懂 | Scrum 四个会议及正确召开方式 | Scrum 3大角色及其岗位的具体职责 | Scrum三大工件在敏捷开发中的作用 | 2022年14个最佳 Scrum 敏捷项目管理软件 | 更多
使用看板(Kanban)管理方法的5大好处 | 看板 VS Scrum:如何选择? | 看板和 Scrum 的混合模式适合在哪些场景使用 | 更多
敏捷项目管理与瀑布式项目管理对比 | 建立高效的敏捷工作流4个步骤 | 史诗、特性、用户故事如何帮助研发团队管理工作? | 敏捷开发中故事点估算方法、步骤 | 4个指标衡量、优化敏捷项目管理 | 更多
Keep 的开发流程是基于 Scrum ,该流程要求在特定的一段时间内,输出确定的需求,在开发中需求尽量不要变更,开发人员快速完成开发。当前,Keep 的迭代和发版周期为两周,保持两周一更新,这样能让用户一直对产品保持新鲜感,也使团队的开发更有节奏。 Keep 技术开发的迭代周期和流程如下图所示:

为了在两周时间内完成高质量产品,我们需要尽最大努力去执行 Scrum 中的每一步,同时在 Scrum 流程上做了一些适合团队的调整和优化。
1、需求评审与确定
产品经理会使用 Keep 的数据平台分析往期功能的数据来确定是否要做调整和改进,以及结合用户反馈系统的反馈来确定是否要添加某一项新功能。在产品内部评审和优化之后,产品经理会和各个业务的技术负责人再一起去做需求的评审,确保需求的合理性和重要程度。接下来我们会将需求拆分到各个开发人员,通过估时来确定每一个 Sprint 具体完成的任务。另外我们将 Phabricator 中的需求任务和我们的聊天工具 BearyChat 做了关联,之后当需求发生改变的时候,都会自动的发一条变更消息给这个需求群组中的同事,节省了需求变更后的沟通成本。
2、任务拆分与评估
任务拆分是整个流程中重要的一环,在 Scrum 中我们是这样进行任务拆分和评估的。首先在技术组内会花半天时间讨论,将产品 Task 再次拆分为子任务,对应的开发 Owner 会提前准备好需求设计方案和评估时间点,然后组内同事对开发 Owner 提出的设计方案进行建议和二次评估,得出拆解完的子任务和对应的估点时间表。
我们使用 Phabricator 的 Workboard 进行排列和展示,把所有拆解后的 Task 放到 Workboard 的一列中,同时在子 Task 中填写评估的时间和设置 Task 的优先级。如下图所示,Workboard 可以非常清晰的划分出每个任务,同时可以清楚的看出 Task 的完成程度。在右上角可以看到整个需求被拆成了多少个子 Task,以及需要消耗的开发时间。使用 WorkBoard 让我们的任务划分更加清晰,根据任务状态来跟进目前整体的进度,有助于整体项目的把控。

3、高效沟通与开发
任务拆分和评估完成后,进入开发阶段。在正式迭代开始之前,会确定一名产品同事作为 Scrum Master 来推动整个项目。除此之外,当涉及到需要多个技术团队支持的需求,我们会指定一名技术同事来负责沟通和协调。这样既解决了产品同事不了解技术协调技术沟通的难题,也提高了技术同事的沟通能力。
在开发过程中,必要的沟通会议是不可或缺的。如何减少不必要的会议,提高会议的效率是我们一直努力的方向。目前 Keep 的会议采用 Google Calendar 邀约的方式,被邀请者可以根据自己的时间和会议的重要性来选择要不要参加,同时会议的组织者也可以清楚的查看其他人的时间防止安排冲突。
此外我们通过一系列消息自动推送服务来减少开发人员之间的沟通成本,比如 Server 服务上线、有新的测试包、Bug 状态变更、新的用户反馈等等各种通知都采用 BearyChat 的 Robot (聊天机器人) 来通知,极大降低了沟通成本。Keep 技术团队内部还使用了如 Seafile, Google 企业套件、Alfred、ResuceTime 等各种工具来提升团队和个人的开发效率。
4、质量把控与测试
项目质量也是在开发过程中不可忽视的一环。Keep 代码使用 Phabricator 来托管和 Code Review。我们设置了主要项目的代码提交前必须做 Code
Review,同时每个项目设置2 - 3位资深的工程师作为
Block Reviewer,合入主干必须得到 Block Reviewer 的同意。对于比较重要、大型的 Diff ,我们会单独拉会议室邀请多位工程师来共同 Review 以保证代码质量,并要求代码作者在每次提交之前都应该自己过一遍代码,走一遍冒烟测试,确保基本的功能是完整的。
进入测试阶段前,我们添加了 Show Case 环节。其实 Show Case 就是产品在工程师提交给 QA 之前组织开发人员、设计师、测试人员简单过一遍功能点,发现逻辑上比较明显的一些问题交给开发人员再次修改,以及确保整体流程不会被严重的 Bug Block 住。团队内部测试完毕后,会使用内部自动化发布工具发给用户升级,在一周内进行内测和灰度两次测试。我们使用微信群运营维护了一批忠实的用户粉丝作为内测用户,内部测试覆盖规模大致为 500 人,灰度测试的覆盖规模增加到 2000 人,一方面验证内测的 Bug 是否被解决,另一方面避免遗漏概率低于 0.1% 的问题。
5、迭代总结与复盘
最后是整个迭代末期的总结和复盘。我们会组织一场回顾会议拿出这个 Sprint 版本产品、技术功能点进行展示,同时对线上功能进行数据的同步。如下图展示了 Keep 的部分数据:

我们会根据这些数据进行分析和总结,验证之前的需求是否达到想要的目的,做的 A/B Test 哪一个更有效。此外回顾会议会记录下大家讨论出在这次 Sprint
中有哪些做的好的地方,有哪些值得改进的地方,并在之后的 Sprint 中加以改正。
在开发过程中也难免会遇到线上的一些事故,比如服务器冗机、客户端出现严重质量问题。在 Phabricator 中有一个专门的 Project 叫 Post Mortem 来记录每次线上发生的事故,记录这些事件发生的原因、经过、结果以及对于整个事件的反思和总结,只有这样才能不断提升我们的能力,让团队在反思中成长。
以上则是 Keep 在用户高速增长过程中践行的技术开发流程。我们使用更加高效的工具来提升团队的开发效率,通过更严格的 Review 来确保证代码质量,建立灰度测试流程来提高项目的质量,在数据分析和项目复盘总结反思中调整方向和保持团队成长。相信各个公司团队都有着适合自己团队的一套开发流程,也许 Keep 目前的开发流程不是最好的,但我们一直努力去更加积极探索和优化目前的开发流程,让团队协作更加简单高效。