专场:稳定性全链路
全链路稳定性保障是当前互联网技术中的一项系统性大工程,旨在通过全面压测、容量规划、全域可观测性建设、技术风险应急处置等多手段确保系统在复杂环境下的稳定运行。
在当今微服务架构盛行的时代,服务的模块化和分布式部署为系统的可扩展性和灵活性带来了极大的提升,但同时也带来了系统稳定性的新挑战。在这种背景下,全链路稳定性保障的概念应运而生,其核心在于通过精准评估和优化整个业务系统(尤其是核心业务链路)的容量和性能,来确保系统在高并发、大数据量的场景下能够稳定运行。
此外,面对复杂的微服务架构和快速变化的业务需求,持续的技术创新和方案优化也是全链路稳定性保障不可忽视的一部分。例如,利用更先进的压测工具和技术平台提高压测的准确性和效率,采用人工智能和机器学习技术智能预测系统瓶颈并提出优化建议等,都是值得探索的方向。本专场也诚邀行业内相关方向技术专家一起对相关技术实践进行探讨与交流。
专场出品人:马鑫
京东零售 平台产品与研发中心 技术保障部 测试架构师
拥有15年以上互联网及传统行业丰富测试经验,2010年底加入京东,擅长业务质量测试、自动化测试、性能测试以及持续集成等多个领域;
  1. 1. 负责京东618/双11/春晚等大型营销活动的压测技术实践与前沿压测技术的探索落地;以及带领团队构建适用于京东的分布式压测平台;
2. 负责线上技术故障的应急处置、故障、改进推动,以及推动技术风险平台建设
韩金成
360 智能搜索事业部 测试开发资深专家
在360智能搜索事业部,主导通用搜索与AI引擎的质量保障、数据挖掘与指标体系构建,并开发高效工具平台。擅长测试方案设计及平台架构,带领团队创建了Teipe全链路自动化测试与Davinci数据分析平台,大幅提升了测试效率与数据分析能力,促进了产品、研发与测试的协同与质量共建,为团队带来显著的效能提升与技术创新。
待定
待定
360搜索全链路性能测试
1. 介绍全链路性能测试概念与重要性
2. 如何在大数据场景下、多环境与数据依赖下如何完成高保真全链路性能测试
3. 介绍测试方案、测试策略、测试目标、风险控制方案的制定思路与问题规避方法
4. 如何构建多维度指标体系,深化性能评估与风险识别

听众收益

通过分享360搜索在全链路性能测试中的实施方法和遇到的挑战,听众将了解大数据场景下的性能测试方法与风险规避方法、了解在复杂的数据环境和多变的测试条件下,实施高效且高保真度的全链路性能测试的方法,提高测试方案与测试策略设计能力,结合自身业务进行指标体系优化。
易龙
vivo 互联网大数据专家
数据集成研发团队负责人
易龙,vivo互联网 大数据专家, 数据集成研发团队负责人,拥有10 年大数据领域实践经验,21年加入vivo,负责数据集成工作,曾先后就职于华为、腾讯。对海量数据下关于数据全链路稳定性保障、数据质量、数据SLA保障、数据价值挖掘以及数据链路成本优化等场景化整体方案设计落地和价值交付有丰富的实践经验。交局12篇大数据领域技术专利。
待定
待定
vivo海量数据集成全链路稳定性保障实践
议题主要是介绍vivo海量数据集成全链路稳定性保障实践,包括vivo海量数据采集产品、技术架构,数据全链路稳定性遇到的问题,以及有效应对这些问题的数据集成全链路稳定性整体保障方案、关键技术等,例如 关键组件技术架构优化、集群异常容错、链路数据反压容错、故障演练故障恢复能力建设、以及结合数据SLA保障的技术、链路数据质量(完整性、时效性)保障,链路可观测的技术方案和实践介绍。

内容大纲
1. vivo海量数据集成介绍
   1.1 产品架构
   1.2 技术架构
2. 全链路稳定性性保障实践介绍
   2.1 问题和挑战
   2.2 整体保障方案及效果
   2.3 方案实践举例
3. 未来规划

听众收益
了解vivo海量数据集成产品及架构原理,对如何制定海量数据全链路稳定性保障的整体方案有所启发,包括在集群异常容错、链路数据反压容错、故障演练故障恢复能力建设、以及结合数据SLA保障的技术、链路数据质量(完整性、时效性)保障,链路可观测的技术方案和实践 都可有所借鉴或直接采用。
金梦珂
bilibili 资深测试开发工程师
哔哩哔哩 资深测试开发工程师,目前主要负责压测平台、故障演练平台、自动化测试平台等平台的建设,负责相关方案在公司内各业务的方案落地,助力业务的稳定性保障体系建设。毕业后曾就职于百度上海,从事大数据相关的质量工作。
待定
待定
B站JAVA框架故障演练平台实战
内容大纲
1.背景
  1.1 介绍故障演练的概念和背景
2.故障演练平台
  2.1 介绍B站业务故障演练的诉求和痛点
  2.2 介绍B站故障演练平台的设计
3.如何实现Java框架故障注入
  3.1 Java故障演练框架的选型
  3.2 故障演练平台整体流程
  3.3 故障演练的安全性
  3.4 自动化故障演练
4.总结
  4.1 B站故障演练平台的现状总结

 
杨雪
360 平台技术测试部 测试开发专家
2019年加入360作为云业务测试接口人,负责容器云、云计算管理平台等项目质量保证工作。(360技术中台在云计算战略已经持续深耕多年,提供了一系列如分布式计算、分布式存储服务、云服务调度、混合云能力接入、计费及监控报警部署等能力,打造出一套既具虚拟化又具容器与容器云的完成私有化部署的企业级的应用与集群实验行业发布的统一管理平台。

基于此360效能平台部下设的质量工程部建立了一支具有相关技术能力的测试团队,其中涌现出了具备云业务资深测试能力的专家级质量保证人员杨雪这样的优秀人才,其在云服务高可用稳定性测试方面进行了方案设计、工具开发和场景演练的实现与执行,同时也在不断探索云计算领域的测试深度和测试方案,并进行工具能力的建设以对此领域提供更多的选择测试方案。)

擅长领域:云计算与云服务架构服务端测试,高可用稳定性测试、测试工具与脚本开发
待定
待定
自动化混沌工程:加速容器云平台稳定性验证与用户体验优化
在当今快速迭代的云原生时代,确保容器云平台的稳定性和可靠性成为企业数字化转型的关键。本次分享将深入探讨如何在Kubernetes(k8s)集群上部署自动化编排的混沌实验服务,以降低混沌实验的手动编排成本,并通过自动化测试构建容器云平台的稳定性观测系统。同时,我们还将介绍一种创新的UI自动化测试方案,旨在帮助容器云用户轻松构建个性化的稳定性观测方案,共同推动云服务的持续优化与用户体验的提升。

内容大纲
1. 引言:概述混沌工程的重要性及手动编排的局限性。
2.  自动化编排服务:介绍在k8s集群上部署的自动编排服务,实现集群与用户工作负载的自动异常注入。
3.  稳定性观测系统:通过自动化测试构建容器云平台的稳定性观测系统,实时监控与评估系统表现。
4.  UI自动化测试方案:详细阐述录制-生成文本自适应的UI自动化代码流程,助力用户构建个性化稳定性观测方案。
5.  应用场景展示:分享该方案在多个场景中的成功应用案例。
6. 总结与展望:总结自动化混沌工程的价值,展望其在容器云领域的未来发展趋势。

听众收益
1. 降低成本:学习如何通过自动化编排服务显著降低混沌实验的手动成本。
2. 提升效率:掌握构建稳定性观测系统的自动化测试方法,加快问题发现与解决速度。
3. 增强用户体验:了解UI自动化稳定性观测方案,为容器云用户提供更稳定、可靠的服务体验。
关注QECon公众号
关注QECon视频号
议题投稿
lijie@qecon.net
商务合作
151-2264-3988  木子
票务联系
186-4907-7637 胡利利 
媒体合作
135-1619-6409  皮皮
购票咨询
胡利利 18649077637
服务总线
400-183-9980