使用 pyroscope adhoc 加速找到效能瓶頸
文章轉錄自『使用 pyroscope adhoc 加速找到效能瓶頸』
大家在開發軟體時,會快速迭代專案時程跟需求,功能越多,系統就會開始出現效能上的瓶頸,而最快的解決方式就是先垂直擴展,把 CPU 跟記憶體先往上加,但是這是治標不治本,所以之前有推薦大家一套如何在服務執行時,快速找到哪個地方執行較慢,請參考之前的文章『即時效能分析工具 Pyroscope』,Pyroscope 目前支援了很多語言,像是 Go, Python, Java, Ruby, Rust, PHP 及 .Net,如果你想要快速在本地端找到效能瓶頸,請繼續將本篇看完。底下會用 Go 語言實際範例教大家。
為什麼要用 adhoc profiling#
Pyroscope 近期內推出 adhoc profiling 功能,大家想看看為什麼官方要推出此功能。原本 Pyroscope 推出此開源平台可以讓開發者在平台上線時,快速從時間點找到效能瓶頸的地方,但是移動到該時間點時,你會看到很多雜訊,而要持續檢測,開發者需要一直進行測試,而這方式無法在本地端快速驗證出來。
所以 Pyroscope 目標是推出 adhoc profiling 功能,讓開發者可以在本地透過 Pyroscope 快速驗證及找到效能瓶頸,而不用運行一整個服務,只要將特定的流程抓出來透過 Script 方式將效能數據產生出來,並且透過 Pyroscope CLI 直接讀取看數據。
adhoc profiling 使用方式#
使用 adhoc mode 可以讓開發者在執行 Script 時,監控所有效能瓶頸,並且透過 Pyroscope UI 介面快速看到結果,底下來看看如何使用 adhoc
mode,開發者可以使用 pyroscope CLI 來完成此功能。先看看 Go 範例
package main
import (
"math"
"math/rand"
"github.com/pyroscope-io/pyroscope/pkg/agent/profiler"
)
func isPrime(n int64) bool {
for i := int64(2); i <= n; i++ {
if i*i > n {
return true
}
if n%i == 0 {
return false
}
}
return false
}
func slow(n int64) int64 {
sum := int64(0)
for i := int64(1); i <= n; i++ {
sum += i
}
return sum
}
func fast(n int64) int64 {
sum := int64(0)
root := int64(math.Sqrt(float64(n)))
for a := int64(1); a <= n; a += root {
b := a + root - 1
if n < b {
b = n
}
sum += (b - a + 1) * (a + b) / 2
}
return sum
}
func run() {
base := rand.Int63n(1000000) + 1
for i := int64(0); i < 40000000; i++ {
n := rand.Int63n(10000) + 1
if isPrime(base + i) {
slow(n)
} else {
fast(n)
}
}
}
func main() {
// No need to modify existing settings,
// pyroscope will override the server address
profiler.Start(profiler.Config{
ApplicationName: "adhoc.example.go",
ServerAddress: "http://pyroscope:4040",
})
run()
}
接著執行底下指令
pyroscope adhoc go run main.go
執行完畢後,你可以看到在同一層目錄多了很多 HTMl 檔案,而這些檔案就可以分享給其他同事參考,相當方便來當作團隊溝通的工具,讓其他同事也可以對照此數據,才不會沒有對焦到正確的地方。
點開 CPU Profiling 可以看到如下:
除了點開 HTML 檔案之外,大家也可以用 pyroscope CLI 在本機端打開 Server 服務,此時 Server 服務會去讀取家目錄內 ~/.pyroscope/pyroscope/
位置,裡面存放開發者每次的 Profiling JSON 格式數據。請打開 http://localhost:4040
從上圖可以看到點選左邊 Single View,就可以看到上面出現 pyroscope data 的 Tab,裡面就是該目錄內所有數據,可以即時呈現及比較數據。
線上 Profiling 服務#
如果連本地端都不想安裝任何環境,可以透過底下兩個線上服務來完成。
可以將有效能問題的程式碼放到 Playground 上,並分享給團隊其他同仁,直接線上修改測試即可,其實跟 Go 提供的 Playground 差不多意思。
心得#
有了這個功能幫助挺大的,尤其時想在本機端做一些效能上分析,雖然有 pprof 可以使用,但是沒有好的 UI 介面,還是很難縮短除錯時間,而有了 adhoc 功能,還可以將數據分享給其他同事一起來幫忙。畢竟服務正式上線後,不會將 pyroscope 功能啟動,免得服務受到效能上的影響,而在測試站就會隨時監控,搭配 Prometheus + Grafana 找出特定時間點效能變化。
上面第一段有提到,目前支援多種不同語言,大家在本地端就可以快速測試不同寫法帶來不同的效能,而不是要將代碼推上機器後才可以驗證,真的縮短蠻多時間的。也可以在找到問題同時,先將 HTML 檔案附件在 Issue Tracking 系統上。
本作品采用《CC 协议》,转载必须注明作者和本文链接
推荐文章: