Giám sát trong Spring Boot

📅4 hours ago⏱1 min read

Giám sát trong Spring Boot

Một ứng dụng production không chỉ đơn thuần là phải chạy được. Nó phải có khả năng quan sát (observable) và dễ dàng khắc phục khi gặp lỗi. Bạn cần các bước kiểm tra sức khỏe (health checks), các chỉ số (metrics), nhật ký (logs) và các quy trình rõ ràng để xử lý sự cố.

Spring Boot sử dụng Actuator để cung cấp các tính năng này. Actuator cung cấp cho bạn các endpoint như health, metrics và info. Bạn có thể công khai (expose) các endpoint này thông qua HTTP hoặc JMX.

Các lĩnh vực chính cần giám sát:

• Khả dụng (Availability): Kiểm tra uptime, readiness và liveness. • Hiệu năng (Performance): Theo dõi thời gian phản hồi (response times), độ trễ (latency) và thông lượng (throughput). • Lỗi (Errors): Theo dõi các lỗi HTTP 4xx/5xx và các tin nhắn bị lỗi. • JVM: Giám sát heap, bộ nhớ, CPU và các luồng (threads). • Cơ sở dữ liệu (Database): Theo dõi các connection pools và các truy vấn chậm (slow queries). • Kafka: Giám sát consumer lag và tỷ lệ thử lại (retry rates).

Thu thập chỉ số (Metrics Collection)

Spring Boot sử dụng Micrometer để thu thập các chỉ số. Bạn có thể sử dụng Prometheus registry để công khai các chỉ số này. Một thiết lập phổ biến bao gồm:

Spring Boot App → Prometheus → Grafana

Điều này cho phép bạn trực quan hóa dữ liệu ứng dụng trên các dashboard.

Các thực hành tốt nhất về Logging (Logging Best Practices)

Logs giúp bạn hiểu điều gì đã xảy ra trong quá trình xảy ra lỗi. Hãy sử dụng structured JSON logging trong môi trường production để giúp máy tính có thể đọc được logs.

Nên làm:

Ghi log các ID nghiệp vụ như orderId hoặc customerId.
Sử dụng correlation IDs để liên kết các logs từ một request duy nhất.
Bao gồm stack traces cho các ngoại lệ (exceptions).
Sử dụng structured logs.

Không nên làm:

Ghi log mật khẩu, token hoặc dữ liệu cá nhân.
Ghi quá nhiều dữ liệu bên trong các vòng lặp.
Sử dụng System.out.println.
Che giấu lỗi bằng các khối catch trống.

Sự ổn định vận hành (Operational Stability)

Hỗ trợ vận hành có nghĩa là giữ cho dịch vụ ổn định sau khi bạn triển khai. Bạn nên tập trung vào:

Hỗ trợ sự cố để điều tra các vấn đề.
Dashboards và alerts để phát hiện sớm các vấn đề.
Runbooks để hướng dẫn các bước phục hồi.
Chiến lược rollback cho các bản phát hành bị lỗi.

Một dịch vụ Spring Boot mạnh mẽ là dịch vụ dễ giám sát, dễ debug và dễ phục hồi.

Source: https://dev.to/antonio_casado_1fe39cd90e/monitoring-in-spring-boot-1220

Giám sát trong Spring Boot

Continue reading

𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗶𝗻 𝗔𝗜: 𝗠𝗼𝗻𝗶𝘁𝗼𝗿𝗶𝗻𝗴 𝗶𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵

𝗗𝗲𝘀𝗶𝗴𝗻𝗶𝗻𝗴 𝗔𝗻 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗗𝗿𝗶𝘃𝗲𝗻 𝗗𝗮𝘁𝗮 𝗣𝗹𝗮𝘁𝗳𝗼𝗿𝗺

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗠𝘂𝗹𝘁𝗶 𝗥𝗲𝗴𝗶𝗼𝗻 𝗛𝗲𝗮𝗹𝘁𝗵 𝗖𝗵𝗲𝗰𝗸 𝗔𝗴𝗴𝗿𝗲𝗴𝗮𝘁𝗼𝗿

Cách phần mềm giám sát nhà máy cải thiện khả năng hiển thị

Tự động hóa Mã nguồn mở với GitHub