实用技巧:Spring Cloud中,如何优雅下线微服务?
在生产环境中,服务的上下线是不可避免的,我们希望能够优雅地下线微服务。本文基于Spring Boot 2.x + Spring Cloud Finchley讲解实际项目中优雅下线服务的四种方式,并探讨各方式的优缺点。
注:Spring Boot 1.x + Spring Cloud Edgware及之前的方式相同,但配置有区别,本文不做讨论。
方式一:kill java进程【不建议】
使用方式:
kill java进程ID
kill java进程ID
kill java进程ID
该方式借助的是Spring Boot应用的Shutdown hook,应用本身的下线也是优雅的,但如果你的服务发现组件使用的是Eureka,那么默认最长会有90秒的延迟,其他应用才会感知到该服务下线,这意味着:该实例下线后的90秒内,其他服务仍然可能调用到这个已下线的实例。因此,该方式是不够优雅的 。
方式二:/shutdown
端点【不建议】
Spring Boot提供了/shutdown
端点,可以借助它实现优雅停机。使用方式:
- 在想下线应用的
applicationyml
中添加如下配置,从而启用并暴露/shutdown
端点:
management:
endpoint:
shutdown:
enabled: true
endpoints:
web:
exposure:
include: shutdown
management:
endpoint:
shutdown:
enabled: true
endpoints:
web:
exposure:
include: shutdown
management: endpoint: shutdown: enabled: true endpoints: web: exposure: include: shutdown
发送POST请求到/shutdown
端点
curl -X http://你想停止的服务地址/actuator/shutdown
curl -X http://你想停止的服务地址/actuator/shutdown
curl -X http://你想停止的服务地址/actuator/shutdown
- 该方式本质和方式一是一样的,也是借助Spring Boot应用的Shutdown hook去实现的。
方式三:/pause
端点【生产可用,但有一点缺陷】
Spring Boot应用提供了/pause
端点,利用该端点可实现优雅下线。
使用方式:
- 在想下线应用的
application.yml
中添加配置,从而启用并暴露/pause
端点:
management:
endpoint:
# 启用pause端点
pause:
enabled: true
# 启用restart端点,之所以要启用restart端点,是因为pause端点的启用依赖restart端点的启用。详见:https://cloud.spring.io/spring-cloud-static/Finchley.SR2/single/spring-cloud.html#_endpoints
restart:
enabled: true
endpoints:
web:
exposure:
include: pause,restart
management:
endpoint:
# 启用pause端点
pause:
enabled: true
# 启用restart端点,之所以要启用restart端点,是因为pause端点的启用依赖restart端点的启用。详见:https://cloud.spring.io/spring-cloud-static/Finchley.SR2/single/spring-cloud.html#_endpoints
restart:
enabled: true
endpoints:
web:
exposure:
include: pause,restart
management: endpoint: # 启用pause端点 pause: enabled: true # 启用restart端点,之所以要启用restart端点,是因为pause端点的启用依赖restart端点的启用。详见:https://cloud.spring.io/spring-cloud-static/Finchley.SR2/single/spring-cloud.html#_endpoints restart: enabled: true endpoints: web: exposure: include: pause,restart
发送POST请求到/actuator/pause
端点:
curl -X POST http://你想停止的服务实例地址/actuator/pause
curl -X POST http://你想停止的服务实例地址/actuator/pause
curl -X POST http://你想停止的服务实例地址/actuator/pause
执行后的效果类似下图:
- 如图所示,该应用在Eureka Server上的状已被标记为
DOWN
,但是应用本身其实依然是可以正常对外服务的。在Spring Cloud中,Ribbon做负载均衡时,只会负载到标记为UP
的实例上。利用这两点,你可以:先用pause端点,将要下线的应用标记为DOWN,但不去真正停止应用;然后过一定的时间(例如90秒,或者自己做个监控,看当前实例的流量变成0后)再去停止应用,例如kill 应用
,当然如果你足够变态,kill -9 也可以
。
缺点&局限
缺点 | 描述 |
---|---|
不同的版本配置不大一样 | 早期的Spring Cloud版本中,,pause端点是不依赖restart端点的,后来一个pull request导致pause端点必须依赖restart端点…个人给官方提issue,官方最后选择了继续依赖,我也是醉了…… |
无法和Eureka的健康检查配合使用 | 如果你的服务发现组件用的是Eureka,并且你的应用开启了健康检查(eureka.client.healthcheck.enabled = true ,那么/pause 端点无效!!! |
方式四:/service-registry
端点【生产可用】
使用方式:
- 在想下线应用的
application.yml
中添加配置,从而暴露/service-registry
端点:
management:
endpoints:
web:
exposure:
include: service-registry
management:
endpoints:
web:
exposure:
include: service-registry
management: endpoints: web: exposure: include: service-registry
发送POST请求到/actuator/service-registry
端点:
curl -X "POST" "http://localhost:8000/actuator/service-registry?status=DOWN" \
-H "Content-Type: application/vnd.spring-boot.actuator.v2+json;charset=UTF-8"
curl -X "POST" "http://localhost:8000/actuator/service-registry?status=DOWN" \
-H "Content-Type: application/vnd.spring-boot.actuator.v2+json;charset=UTF-8"
curl -X "POST" "http://localhost:8000/actuator/service-registry?status=DOWN" \ -H "Content-Type: application/vnd.spring-boot.actuator.v2+json;charset=UTF-8"
- 由图可知,使用
/service-registry
端点可实现类似/pause
端点的效果。
缺点
暂时没有发现缺点。
拓展一下
在实际项目中,你可以做一个运维工具:
- 运维工具读取服务发现组件中的所有服务。
- 有一天你想下线某个服务的时候,就点击该示例的“优雅下线” 按钮,该按钮会请求到想要下线的服务的
/pause
端点或者service-registry
端点(看你能不能容忍/pause
端点的缺点),这样就可以把该实例在Eureka上标记为DOWN,流量过一段时间后就不会打到这个实例上。 - 做一个流量检测工具(例如QPS统计,这种百度随便找下,最简单的一个过滤器 + map就可以做了),如果检测到当前实例确实已经没有流量进入,就在运维工具上点击另一个按钮,例如停止。真正停止应用。
- 当然,如何停止应用又是另一个问题了,例如你可以请求实例的shutdown端点(Spring Boot提供了优雅下线的端点),或者用脚本kill,或者如果是容器可以借助一些探针……
关注公众号:程序新视界,一个让你软实力、硬技术同步提升的平台
除非注明,否则均为程序新视界原创文章,转载必须以链接形式标明本文链接
本文链接:http://choupangxia.com/2021/07/11/how-to-unregister-service-in-eureka/