Linux知识库总结
This article was written by baixiaozhou on 1738910928000.
集群线上稳定性维护
1月 1 号-6 月30 号每月 30号前完成一次月度集群巡检
1月 1 号-6 月30 号完成值班任务,解决线上告警问题,故障响应时间不超过30min
1月 1 号-6 月30 号无违反运维红线产生的故障
1月 1 号-6 月30 号参与 juicefs 集群监控运维
1月 1 号-6 月30 号参与 KFS 集群监控运维
1月 1 号-6 月30 号参与 KPFS 集群监控运维
1.31 号前完成中邮信源集群桶复制进程异常 GC 修复
2.30 号前完成戴尔上海集群、北京集群电池更换
产品稳定性及日常测试跟进
9 月 30 号前,接入内部集群性能测试,完成百 G 网卡集群性能测试
7 月 30 号前完成 Minimax 集群测试
部署工具升级优化,自动化开发
6.30号前完成 KPFS 自动化部署
bogun 项目白屏化
6.30 号前初步完成 bogun 白屏化项目开发。
2025 1-6 月份 OKR
集群线上稳定性维护
1月 1 号-6 月30 号每月 30号前完成一次月度集群巡检
1月 1 号-6 月30 号完成值班任务,解决线上告警问题,故障响应时间不超过30min
1月 1 号-6 月30 号无违反运维红线产生的故障
1月 1 号-6 月30 号参与 juicefs 集群监控运维
1月 1 号-6 月30 号参与 KFS 集群监控运维1月 1 号-6 月30 号参与 KPFS 集群监控运维
1.31 号前完成中邮信源集群桶复制进程异常 GC 修复
2.30 号前完成戴尔上海集群、北京集群电池更换部署工具升级优化,戴尔集群升级
6 月 30 号前完成 KPFS 部署工具开发
6 月 30 前完成戴尔集群升级
- bogun 项目白屏化
6.30 号前初步完成 bogun 白屏化项目开发。
面试问题
Linux 基础
- 基础命令的使用 (日志检查,基础命令)
- 如何查找一个命令或者文件的路径?(which,find,locate)
- Linux 权限, 755/700/644 的区别
- linux 文件类型
- 如何切换到其他用户?(su 和 sudo 的区别)
- linux 网卡 bond 的模式
- Linux 软链接(symbolic link)和硬链接(hard link)的区别?
- 日志查看, grep,awk,less,more,tail
- 简单脚本, 查看 nginx 日志中最近 10 行 200 请求的平均耗时情况,或者状态码出现的次数
- 网络
- TCP 三次握手和四次挥手
- 如何查看端口占用 (netstat、ss 或者 lsof)
- 如何测试端口连通性(telnet 或者 nc)
- 其他命令
- 查看进程状态 (ps)
- 如何杀死进程 (kill -9, kill ,kill -15的区别)
- 基础命令的使用 (日志检查,基础命令)
监控
- 常用的监控系统用过哪些(用过prometheus 就问一下 promql 语法, 列一下常用的)
- 常用的监控命令 (内存、cpu、负载、磁盘io 等)
自动化工具 ansible 等
- 剧本
- 标签
- 参数等
数据库
- mysql 主从同步原理,配置
- sql 语句的简单查询。group by 等
K8s pod的启动过程中,k8s的各个组件是怎样互相调用的
docker 基础操作,挂载,docker-compose , 深入的话问一下 docker 技术底座,cgroup,文件系统,命名空间这些(作为一个加分项)
日志采集 elk 相关的,问一下 采集链路,分片规划啥的
问题排查
- 系统故障如何排错,CPU 高、内存高、负载高的场景
- 日志查看,系统排错
项目经验:
这个根据实际的项目展开询问,比如有 elk 日志等的就问相关的
开发能力,到时候就问一下基础的
招行鲁班平台对接
命令行参数设置
kingyuctl –token xxx –endpoint xxx
–accesskey –id xxx show
–accesskey –id xxx enable xxx
–accesskey –id xxx disable xxx
–bucketquota
1 | // 通用验证函数(兼容所有切片类型) |