算力卡切分后增加反馈机制

本文以Nvidia显卡为例 流程图: 实现流程: 在watcher模块的NodeWatcher类中修改handleAddEvent方法,监听node信息变化判断gpu的状态是否变为failed或者success,是的话就保存一条站内信到message表中


arthas检测定位iam登录的问题

背景:公司IAM系统的登录过程在压测过程中表现不太行,需要优化性能 一: 问题定位 开发环境为jmeter使用1s20个线程测试 压测记录: 通过arthas一层层trace寻找耗时程序,命令如图:</


docker镜像打包arthas

背景 公司的IAM(Identity and Access Management)系统在生产环境登录过程比较慢,需要定位优化比较耗时的代码,所以引入了Arthas这个第三方工具追踪监控函数执行过程。IAM是通过docker+jenkins自动化部署的,所以需要在构建镜像时将IAM和Arthas打包到