python内存监控工具memory_profiler和guppy的用法_memory_profiler用法-程序员宅基地

python2.7在内存管理上相比python3还是有些坑的，其释放后的内存仍然保留在python的内存池中，不被系统所用。python循环引用的变量不会被回收，这会导致程序越运行，占用的内存越大。我在跑py-faster-rcnn的demo时，基本上跑2000张图像，16g内存就要爆了。于是尝试用python的内存监控工具来调试程序，找到不能膨胀的变量，然后del之，再手动回收内存gc.collec（）

下面是我用的两个内存监视工具，一个是按每行代码查看内存占用的工具memory_profiler，一个是查看占用内存前十位变量的工具guppy。

1. memory_profiler

首先是安装：

pip install -U memory_profiler

然后用profile修饰想要查看的函数名：如：

@profile
def my_func():
    a = [1] * (10 ** 6)
    b = [2] * (2 * 10 ** 7)
    del b
    return a

if __name__ == '__main__':
    my_func()

输出结果:

Line #    Mem usage  Increment   Line Contents
==============================================
     3                           @profile
     4      5.97 MB    0.00 MB   def my_func():
     5     13.61 MB    7.64 MB       a = [1] * (10 ** 6)
     6    166.20 MB  152.59 MB       b = [2] * (2 * 10 ** 7)
     7     13.61 MB -152.59 MB       del b
     8     13.61 MB    0.00 MB       return a

memory_profiler功能强大，更多功能可以看官网这里

2. guppy

首先安装：

pip install guppy

然后import下

from guppy import hpy
hxx = hpy()
heap = hxx.heap()
byrcs = hxx.heap().byrcs;

在主程序下增加：

print(heap)

输出示例：

Index  Count   %     Size   % Cumulative  % Kind (class / dict of class)
     0  10124  22 81944416  95  81944416  95 list
     1  16056  34  1325464   2  83269880  96 str
     2   9147  20   745616   1  84015496  97 tuple
     3    102   0   366480   0  84381976  98 dict of module
     4    287   1   313448   0  84695424  98 dict of type
     5   2426   5   310528   0  85005952  98 types.CodeType
     6   2364   5   283680   0  85289632  99 function
     7    287   1   256960   0  85546592  99 type
     8    169   0   192088   0  85738680  99 dict (no owner)
     9    123   0   142728   0  85881408  99 dict of class

可以看到第一个list占了95%的内存，若print（heap）在主程序的循环中，可以查看每次循环后的变量内存占用情况。

输入以下命令，查看这个占内存最大的list中的数据类型：

byrcs[0].byid

最后测试后发现，test.py下get_im_blob等函数占用内存不断增大，每检测一副图像，该函数增加6-10MB内存开销。但奇怪的是用guppy查看前十个变量，并没有发现哪个变量有明显的内存增大迹象。于是猜测可能是每张图像推理后，推理的结果bbox，label，img等数据保存在了内存中，这样方便所有图像推理结束后，plt.show（）.于是修改程序，每张图像推理后，plt.show（）一下。用memory_profiler发现内存不再继续增大，interesting！其实把plt.show()改成plt.close()也可以防止内存不断增大。具体原因肯定是python 的内存回收机制规则导致的。

本文链接：https://blog.csdn.net/meccaendless/article/details/79701726

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

低代码可视化开发理念在物联网APP开发中的应用_低代码可视化平台项目理念-程序员宅基地

文章浏览阅读5k次，点赞2次，收藏44次。云编排式物联APP开发平台可通过云端可视化编排开发，边端远程自动化部署，云边协同管理运维的方式，实现物联网APP快速开发，海量边端应用管理。_低代码可视化平台项目理念

数据的两种归一化方法_数据量级相差较大归一化-程序员宅基地

文章浏览阅读1.3k次。数据标准化（归一化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。一般而言，数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的..._数据量级相差较大归一化

立志进大厂的Owen-程序员宅基地

文章浏览阅读335次。为什么写博客？目录为什么写博客？

图表示学习Graph Embedding：DeepWalk python实现_graph embedding python-程序员宅基地

文章浏览阅读1.1w次，点赞12次，收藏45次。https://github.com/AI-luyuan/graph-embedding_graph embedding python

【JAVA开发小技巧】使用enum枚举类规范化代码_枚举代码规范-程序员宅基地

文章浏览阅读433次，点赞6次，收藏11次。阿里巴巴Java开发手册中推荐，如果常量类中变量值仅在一个范围内变化，且带有名称之外的延伸属性，建议定义为枚举类。使用枚举类可以使我们的代码更加规范且美观。_枚举代码规范

Python基础教程：strip 函数踩坑_python的rstrip为什么没用-程序员宅基地

文章浏览阅读430次。S.strip(chars=None)strip 函数用于去除字符串首尾的空格，当 chars 不为 None 时，则删除字符串首尾的 chars 中的字符。当 chars=None 时，去除首尾空格，没啥好说的，我们来看 chars 不为 None 时的情况。str = 'abc123abc'print(str.strip('a')) # bc123abcprint(str.strip('abc')) # 123结果跟预期的一样，我们再看下面的例子：'''Pyth_python的rstrip为什么没用