容器升级内核及重启后遇到的问题

前景描述

公司10台物理服务器,系统为Redhat7.9,因安装K8S,需将内核升级至3.10.0-1060以上,并修改相关参数,否则会造成内存泄露问题。

操作步骤

需要用到的升级包及顺序如下

linux-firmware-20190429-72.gitddde598.el7.noarch.rpm

kernel-tools-libs-3.10.0-1062.4.1.el7.x86_64.rpm

kernel-tools-3.10.0-1062.4.1.el7.x86_64.rpm

kernel-headers-3.10.0-1062.4.1.el7.x86_64.rpm

kernel-devel-3.10.0-1062.4.1.el7.x86_64.rpm

kernel-3.10.0-1062.4.1.el7.x86_64.rpm

file

问题汇总

  • 重启后服务器长时间无法SSH链接且无法PING通,登陆BMC控制台查看,发现已进入系统引导界面并卡在“start crash recovery kernel arming.ails.nt. certficates”
  • 通过卡主此行描述得知“Crash Recovery与kdump服务有关”,进行查阅资料得知需在/etc/default/grub中加入“crashkernel”参数
  • 我的服务器grub文件中未发现自动配置的“crashkernel=auto”参数,所以缺少此参数,故重启后停留在“start crash recovery kernel arming.ails.nt. certficates”界面。

Kdump服务及CrashKernel参数

kdump
  • 什么是kdump
    kdump是一种先进的基于 kexec 的内核崩溃转储机制。当系统崩溃时,kdump 使用 kexec 启动到第二个内核。第二个内核通常叫做捕获内核,以很小内存启动以捕获转储镜像。第一个内核保留了内存的一部分给第二内核启动用。由于 kdump 利用 kexec 启动捕获内核,绕过了 BIOS,所以第一个内核的内存得以保留。这是内核崩溃转储的本质。
  • 什么是Kexec?
    kexec 是一个快速启动kernel的机制,它运行在某一正在运行的kernel中,启动一个新的kernel(这里是crash kernel),而且不用重新经过BIOS 就可以完成启动。因为一般BIOS都会花费很长的时间,尤其是在大型并且同时连接许多外部设备的Server上的环境下,BIOS会花费更多的时间。
CrashKernel
  • 如果系统的内存 <= 8 GB 对kdump kernel不会保留任何内容;也就是说,crashkernel=auto 等于关掉了机器上的kdump功能。
  • 如果系统的内存 > 8 GB 但是 <= 16 GB,crashkernel=auto会保留256M,等同于crashkernel=256M;
  • 如果系统内存> 16GB, crashkernel=auto会保留512M, 等同于crashkernel=512M

解决方法

1.开机进入系统引导菜单界面,并进入单用户模式
2.进入单用户后进行如下操作:

mount -o remount,rw /sysroot
chroot /sysroot
vim /etc/default/grub

3.在lv或硬盘分区quiet前加入“crashkernel=512M”即可。

[c-downbtn type=”123″ url=”https://www.123pan.com/s/Iu2eVv-zSXod.html” pwd=””]文章中RPM包下载地址[/c-downbtn]

原创文章,作者:AIRF,如若转载,请注明出处:http://www.ai-rf.com/index.php/2022/07/09/%e5%ae%b9%e5%99%a8%e5%8d%87%e7%ba%a7%e5%86%85%e6%a0%b8%e5%8f%8a%e9%87%8d%e5%90%af%e5%90%8e%e9%81%87%e5%88%b0%e7%9a%84%e9%97%ae%e9%a2%98/

(0)
AIRFAIRF
上一篇 2022年2月18日
下一篇 2022年8月1日

相关推荐

  • 国内无法访问下载Docker镜像的多种解决方案

    2023年5月中旬, hub.docker.com  “不知” 何种原因国内均无法正常访问了。当时只是官网不能访问,但是不影响pull镜像。 20…

    ChatGPT 2024年6月16日
  • 【一】K8s的组件及概念

    K8s的组件 master: 集群的控制平面,负责集群的决策 ApiServer:资源操作的唯一入口,接收用户输入的命令,提供认证、授权、API注册和发现等机制 Scheduler…

    2023年9月17日
  • 【七】K8S_存储卷

    存储卷介绍 在Kubernetes(K8S)中,存储卷(Storage Volume)是一种持久化的存储机制,用于在Pod中保存数据,并提供了一种抽象层来将底层存储技术(如本地磁盘…

    2023年9月17日
  • 【四】K8S_Deployment

    Deployment作用 Kubernetes(K8S)中的 Deployment 是用于定义和管理应用程序部署的重要资源对象。Deployment 在 K8S 中具有以下用途和相…

    2023年9月17日
  • 【精选】kubectl 常用命令指南

    kubectl 常用命令指南 Kubctl 命令是操作 kubernetes 集群的最直接的方式,特别是运维人员,需要对这些命令有一个详细的掌握 Kubectl 自动补全 # se…

    ChatGPT 2023年12月26日
  • K8S一键搭建集群脚本

    #!/bin/bash # Author: Nuoyo # mail:2469329338@qq.com RED=”33[31m” # Error message GREEN=”3…

    2023年9月17日
  • docker迁移备份容器到其他机器

    1 把当前的容器提交为一个镜像: docker ps -a  查看运行的容器ID docker commit 容器名 镜像名 2 将镜像存为tar文件 docker save 镜像…

    ChatGPT 2023年7月15日
  • kubernetes 运维必会的常用命令合集

    查看 kubectl cluster-info     # 查看集群信息kubectl get no -o wide     # 获取节点和服务版本信息,并查看附加信息kubect…

    Deepseek 2023年12月16日
  • 适合在虚拟化环境中运行 Kubernetes 的几个场景

    1. 前言 虚拟化技术的快速发展为企业提供了更高的灵活性、资源利用率和成本效益。同时,Kubernetes作为一个开源的容器编排系统,能够有效地管理和调度容器化应用程序。将Kube…

    Deepseek 2023年9月19日
  • 【二】快速搭建卸载K8S集群

    准备工作 需要Linux CentOS 7.x 两台及以上,本文用的 7.9。 Master最低配置2C2G 安装步骤多个节点可以并行操作,默认所有操作各节点都要执行,某些操作仅主…

    2023年9月17日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注