这篇文章整理了 Spring Boot 和常见的应用中间件配置含义,做到这些配置的目的和原理,避免因为错误配置导致生产出现问题,特别是有一些安全事项。

PS:写下来发现东西非常多,很多时候我们都只是拷贝过来改改没问题就不管了,但是这样囫囵吞枣,会给项目带来风险。

01 Spring Boot 相关

优雅停机

优雅停机是指当应用接收到停机信号时,能够妥善地处理正在进行的请求,释放资源,并在完成这些工作后再停止应用。

如果不开启优雅停机,有可能在部署的过程中让少量未完成的任务和请求直接终止,带来意想不到的问题。

默认情况下,Spring Boot 没有启用优雅停机,而且往往需要和云环境配合使用。

在 Spring Boot 中的配置方式为(本文以 yaml 的格式):

server:
  shutdown: graceful

同时可以设置一个优雅停机的超时时间,如果在超时时间内请求没有完成,应用将强制停机。

spring:
  lifecycle:
    timeout-per-shutdown-phase: 30s

Kubernetes 在停止 Pod 时,会先发送一个 SIGTERM,并通过 Readiness Probe和Liveness Probe 两个探针来决定是否释放容器资源。

探针就是应用通过一个 API(可以是 HTTP 或者 TCP,通常都是 HTTP)告诉 Kubernetes 它当前的状态,让 Kubernetes 来决策何时重启,关于优雅停机的内容比较多,后面单独一篇文章讨论。

在 Spring Boot 中,探针就是 Spring Boot 的 health 接口,可以通过 Indicator 配置。

Indicator

Spring Boot 提供了一些健康状态的 API,这样就可以给云平台优雅停机使用,也可以提供给监控系统用来拨测,如果系统长时间不健康,可以进行告警。

在代码中实现健康状态的类叫做 Indicator,基本上默认配置的 Indicator 就够用了,但有时候需要根据自己需要配置一些 Indicator。

比如依赖了一个重要的三方系统,这个三方系统不启动起来,当前系统启动了也没意义,于是就可以加一个 Indicator,甚至把三方系统的状态暴露到当前系统的健康状态信息中。

暴露相关健康 API 需要引入一个 actuator 依赖。

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
import org.springframework.boot.actuate.health.Health;
import org.springframework.boot.actuate.health.HealthIndicator;
import org.springframework.stereotype.Component;

@Component
public class CustomHealthIndicator implements HealthIndicator {

    @Override
    public Health health() {
        boolean isHealthy = checkSomeServiceHealth();
        
        if (isHealthy) {
            return Health.up().withDetail("customService", "UP").build();
        } else {
            return Health.down().withDetail("customService", "DOWN").build();
        }
    }

    private boolean checkSomeServiceHealth() {
        // 检查逻辑
        return true; 
    }
}

访问 /actuator/health 接口,返回结果大概像下面这样:

{
  "status": "UP",
  "components": {
    "db": {
      "status": "UP",
      "details": {
        "database": "MySQL",
        "validationQuery": "isValid()"
      }
    },
    "customService": {
      "status": "UP",
      "details": {
        "CustomService": "UP"
      }
    },
    ……
  }
}

打开相关配置:

management:
  endpoints:
    web:
      exposure:
        include: health,info

在这个配置中,info 类似 health, 提供了一些服务信息,例如名称、版本之类的,但是要注意避免把敏感信息从这个接口中暴露出去了。

Actuator

提到了 Actuator,这里有一些配置是不能在生产环境开启的,这是比较常见的错误,需要注意。

Actuator 除了提供了 health,info 两个接口,还提供了一堆接口,方便观察 Spring Boot 应用,这些接口都可以在开发环境开启。例如:

  • /health: 显示应用的健康状态及详细信息。
  • /info: 显示应用的一些基本信息(例如版本、描述等)。
  • /env: 查看和调试环境属性,了解配置项的来源。
  • /beans: 用于调试 Bean 的创建和依赖关系。
  • /metrics: 查看应用的性能指标,如内存使用情况、GC 活动等。
  • /httptrace: 用于查看最近 HTTP 请求的详细信息。
  • /mappings: 用于查看所有请求映射的路径,方便调试路由问题。

这些接口开启后会造成安全、性能问题。

所以推荐的配置如下。

开发环境:

management:
  endpoints:
    web:
      exposure:
        include: "*"
  endpoint:
    health:
      show-details: always  # 显示详细健康信息,方便调试

endpoints 只是暴露外部是否可以访问,实际的功能需要单独开启,health,info,metrics 三个接口是默认开启的。

如果需要打开 beans,可以单独开启:

management:
  logfile:
    enabled: true           # 允许查看日志文件,方便调试
  env:
    enabled: true           # 允许查看环境变量配置
  configprops:
    enabled: true           # 允许查看配置属性,帮助调试
  beans:
    enabled: true           # 允许查看 Bean 信息,调试依赖关系
  heapdump:
    enabled: true           # 启用 Heap Dump,用于内存分析
  threaddump:
    enabled: true           # 启用线程转储,用于线程分析
  mappings:
    enabled: true           # 允许查看所有请求映射,调试路由问题
  httptrace:
    enabled: true           # 启用 HTTP 请求追踪

而生产环境,需要将其关闭,只保留需要开启的配置:

management:
  endpoints:
    web:
      exposure:
        include: "health,info,metrics"
  endpoint:
    health:
      show-details: never   # 隐藏健康检查的详细信息,防止敏感数据泄露

日志

日志配置错误会导致磁盘被日志写满,另外日志级别过低,性能会急剧下降。

在以前还不是容器时代,我们常常使用日志文件存储日志,再使用一些工具转存走,有时候清理日志的脚本失效,导致磁盘被日志写爆的场景非常多。

下面是一个在容器环境下 Spring Boot 默认日志库的配置:

logging:
  level:
    root: INFO
    org.springframework: WARN #这里放上特定包的日志配置
  pattern:
    console: "%d{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg%n"
  file:
    enabled: false # 生产环境通常不直接写入文件,而是由 K8s 日志收集系统处理
  stdout:
    enabled: true

在生产上我们一般将日志级别设置为 INFO,并关闭文件输出,而是将日志输出到 stdout 中,由容器捕获。

在开发环境,我们通常把日志设置为 DEBUG,更加方便调试。

秘钥和口令

正常情况下,大多数应用都不会把口令存放到配置文件中,敏感信息需要放到秘钥管理系统中(Key Management System)。

例如,在 k8s 中,我们可以使用 Secrets 代替明文的 ConfigMap;云平台往往提供了相关的 KMS 产品,例如 Alicloud KMS。

02 Mysql

这里给出一个 Mysql 和 Mybatis 的典型配置,并解释一下关键配置的含义和避坑经验。

spring:
  datasource:
    url: jdbc:mysql://localhost:3306/mydatabase?useUnicode=true&characterEncoding=utf-8&useSSL=false&serverTimezone=UTC&autoReconnect=true&rewriteBatchedStatements=true
    username: your_username
    password: your_password
    driver-class-name: com.mysql.cj.jdbc.Driver
    hikari:
      maximum-pool-size: 10
      minimum-idle: 5
      idle-timeout: 30000
      max-lifetime: 1800000
      connection-timeout: 30000

mybatis:
  mapper-locations: classpath*:mapper/*.xml
  type-aliases-package: com.example.project.domain
  configuration:
    map-underscore-to-camel-case: true
    log-impl: org.apache.ibatis.logging.stdout.StdOutImpl

连接字符串中的配置:

  • useUnicode: 启用了 Unicode 支持。
  • characterEncoding: 字符编码,最好在 useUnicode 配置后,characterEncoding 也明确配置一下,否则它会选择一个默认的 Unicode 字符编码。另外,我们现在用的更多的是 utf8mb4,它是 UTF8 的拓展字符集,可以处理更多特性,例如表情,最多占用 4 个字节的空间。
  • useSSL: 如果启用,需要证书,一般我们都没有配置。
  • serverTimezone:关于时区,我们一般都不让数据库决策,而让应用决定写入数据的时区,这个问题我在以前的文章,《系统设计中需要考虑到的时间问题》,做过详细说明。
  • autoReconnect: 自动重连,如果不开启的话,数据库重启了应用也必须重启。
  • rewriteBatchedStatements: 自动优化批量插入时的性能。

关于 driver-class-name,对于 MySQL Connector/J 8.0 以上,类名换成了 com.mysql.cj.jdbc.Driver,旧版本是 com.mysql.jdbc.Driver。

关于 hikari 配置的含义:

  • maximum-pool-size: 最大连接数,连接池中的最大连接数。
  • minimum-idle: 最小空闲连接数。
  • idle-timeout: 空闲连接被回收前的最大等待时间(毫秒)。
  • max-lifetime: 连接在池中的最长存活时间(毫秒)。
  • connection-timeout: 获取连接的超时时间(毫秒)。

hikari 的配置只是建议值,hikari 配置逻辑是什么呢?一般是基于性能测试反复调整,但还是有一些规律。

这里有个坑,有时候为了优化性能,提高了最大连接数。但一般数据库的连接数是有限制的,比如 1000。假设一个系统共同一个Mysql实例,系统共有 10 个服务,每个服务如果有 10 个容器,最大连接数最多就只能配置到 10 了,否则就会报没有链接的错误(而且是偶尔出现这类问题)。

maximumPoolSize 通常设置为数据库的并发连接限制的 50% 到 80% 之间,单个容器允许 10 个 Mysql 连接并不大,maximum-pool-size 可以在 10 - 50 之间调整。

connection-timeout 过短,在数据库负载高或网络不稳定的情况下,可能导致频繁的连接超时,可以尝试往长一点调整。

max-lifetime、minimum-idle 取决于负载情况,如果持续负载比较高,可以设置长一些,不用为数据库节省资源,让连接长时间保持。

关于 Mybatis 的 map-underscore-to-camel-case 配置有一个坑,这个配置的含义是把数据库列名中的下划线自动映射为 Java 对象中的驼峰命名。例如,user_name 列将映射为 userName 属性。但有的时候,命名不规范,有些词可能是一个词组而没有大写,会导致匹配失败。

03 未完待续

本以为是一个很简单的文章,有点长准备拆一下,把 Tomcat、线程池、Redis、Kafka、JVM 等内容留在后面,大家也可以留言补充这些经验,我添加到后面的内容中。

Last Updated:
Contributors: linksgo2011