性能分析

CPU 性能分析

有两种主要方法可以对 Julia 代码进行 CPU 性能分析

通过 `@profile`

其中，通过 @profile 宏为给定调用启用性能分析。

julia> using Profile

julia> @profile foo()

julia> Profile.print()
Overhead ╎ [+additional indent] Count File:Line; Function
=========================================================
    ╎147  @Base/client.jl:506; _start()
        ╎ 147  @Base/client.jl:318; exec_options(opts::Base.JLOptions)
...

在执行期间触发

已经运行的任务也可以在任何用户触发的时刻对固定时间段进行性能分析。

要触发性能分析

MacOS 和 FreeBSD（基于 BSD 的平台）：使用 ctrl-t 或将 SIGINFO 信号传递给 Julia 进程，例如 % kill -INFO $julia_pid
Linux：将 SIGUSR1 信号传递给 Julia 进程，例如 % kill -USR1 $julia_pid
Windows：目前不支持。

首先，显示在抛出信号时的单个堆栈跟踪，然后收集 1 秒的性能分析数据，然后在下一个 yield 点显示性能分析报告，对于没有 yield 点的代码（例如紧凑循环），该点可能在任务完成后出现。

可以选择将环境变量 JULIA_PROFILE_PEEK_HEAP_SNAPSHOT 设置为 1 以自动收集堆快照。

julia> foo()
##== the user sends a trigger while foo is running ==##
load: 2.53  cmd: julia 88903 running 6.16u 0.97s

======================================================================================
Information request received. A stacktrace will print followed by a 1.0 second profile
======================================================================================

signal (29): Information request: 29
__psynch_cvwait at /usr/lib/system/libsystem_kernel.dylib (unknown line)
_pthread_cond_wait at /usr/lib/system/libsystem_pthread.dylib (unknown line)
...

======================================================================
Profile collected. A report will print if the Profile module is loaded
======================================================================

Overhead ╎ [+additional indent] Count File:Line; Function
=========================================================
Thread 1 Task 0x000000011687c010 Total snapshots: 572. Utilization: 100%
   ╎147 @Base/client.jl:506; _start()
       ╎ 147 @Base/client.jl:318; exec_options(opts::Base.JLOptions)
...

Thread 2 Task 0x0000000116960010 Total snapshots: 572. Utilization: 0%
   ╎572 @Base/task.jl:587; task_done_hook(t::Task)
      ╎ 572 @Base/task.jl:879; wait()
...

自定义

可以通过 Profile.set_peek_duration 调整性能分析的持续时间。

性能分析报告按线程和任务细分。将无参数函数传递给 Profile.peek_report[] 以覆盖此设置。例如，Profile.peek_report[] = () -> Profile.print() 用于删除任何分组。这也可以由外部性能分析数据使用者覆盖。

参考

Profile.@profile — 宏

@profile

@profile <expression> 在定期获取回溯的同时运行您的表达式。这些回溯将追加到回溯的内部缓冲区。