0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能快速找到代碼運(yùn)行最慢部分的編程神器

Linux愛(ài)好者 ? 來(lái)源:Python七號(hào) ? 作者:somenzz ? 2021-10-13 16:40 ? 次閱讀

天下武功,唯快不破。

編程也不例外,你的代碼跑的快,你能快速找出代碼慢的原因,你的碼功就高。

今天分享一個(gè)超級(jí)實(shí)用的 Python 性能分析工具 pyinstrument ,可以快速找到代碼運(yùn)行最慢的部分,幫助提高代碼的性能。支持 Python 3.7+ 且能夠分析異步代碼,僅需一條命令即可顯示具體代碼的耗時(shí)。經(jīng)常寫(xiě) Python 的小伙伴一定要用一下。

安裝

pipinstallpyinstrument

簡(jiǎn)單的使用

在程序的開(kāi)始,啟動(dòng) pyinstrument 的 Profiler,結(jié)束時(shí)關(guān)閉 Profiler 并打印分析結(jié)果如下:

frompyinstrumentimportProfiler

profiler=Profiler()
profiler.start()

#這里是你要分析的代碼

profiler.stop()

profiler.print()

比如這段代碼 123.py,我們可以清楚的看到是列表推導(dǎo)式比較慢:

frompyinstrumentimportProfiler

profiler=Profiler()
profiler.start()

#這里是你要分析的代碼
a=[iforiinrange(100000)]
b=(iforiinrange(100000))

profiler.stop()
profiler.print()

上述分析需要修改源代碼,如果你使用命令行工具,就不需要修改源代碼,只需要執(zhí)行 pyinstrument xxxx.py 即可:

比如有這樣一段排序的程序 c_sort.py:

importsys
importtime

importnumpyasnp

arr=np.random.randint(0,10,10)

defslow_key(el):
time.sleep(0.01)
returnel

arr=list(arr)

foriinrange(10):
arr.sort(key=slow_key)

print(arr)

這段代碼里面故意放了一句 time.sleep(0.01) 來(lái)延遲性能,看看 pyinstrument 能否識(shí)別,命令行執(zhí)行 pyinstrument c_sort.py:

從結(jié)果來(lái)看,程序運(yùn)行了 1.313 秒,而 sleep 就運(yùn)行了 1.219 秒,很明顯是瓶頸,現(xiàn)在我們把它刪除,再看看結(jié)果:

刪除之后,性能最慢的就是 numpy 模塊的初始化代碼 __init__.py了,不過(guò)這些代碼不是自己寫(xiě)的,而且并不是特別慢,就不需要去關(guān)心了。

分析 Flask 代碼

Web 應(yīng)用也可以使用這個(gè)來(lái)找出性能瓶頸,比如 flask,只需要在請(qǐng)求之前記錄時(shí)間,在請(qǐng)求之后統(tǒng)計(jì)時(shí)間,只需要在 flask 的請(qǐng)求攔截器里面這樣寫(xiě):

fromflaskimportFlask,g,make_response,request
app=Flask(__name__)

@app.before_request
defbefore_request():
if"profile"inrequest.args:
g.profiler=Profiler()
g.profiler.start()

@app.after_request
defafter_request(response):
ifnothasattr(g,"profiler"):
returnresponse
g.profiler.stop()
output_html=g.profiler.output_html()
returnmake_response(output_html)

假如有這樣一個(gè) API:

@app.route("/dosomething")
defdo_something():
importrequests
requests.get("http://google.com")
return"Googlesayshello!"

為了測(cè)試這個(gè) API 的瓶頸,我們可以在 url 上加一個(gè)參數(shù) profile 就可以:http://127.0.0.1:5000/dosomething?profile,哪一行代碼執(zhí)行比較慢,結(jié)果清晰可見(jiàn):

分析 Django 代碼

分析 Django 代碼也非常簡(jiǎn)單,只需要在 Django 的配置文件的 MIDDLEWARE 中添加

"pyinstrument.middleware.ProfilerMiddleware",

然后就可以在 url 上加一個(gè)參數(shù) profile 就可以:

如果你不希望所有人都能看到,只希望管理員可以看到,settings.py 可以添加這樣的代碼:

defcustom_show_pyinstrument(request):
returnrequest.user.is_superuser

PYINSTRUMENT_SHOW_CALLBACK="%s.custom_show_pyinstrument"%__name__

如果不想通過(guò) url 后面加參數(shù)的方式查看性能分析,可以在 settings.py 文件中添加:

PYINSTRUMENT_PROFILE_DIR='profiles'

這樣,每次訪問(wèn)一次 Django 接口,就會(huì)將分析結(jié)果以 html 文件形式保存在 項(xiàng)目目錄下的 profiles 文件夾中。

分析異步代碼

簡(jiǎn)單的異步代碼分析:

async_example_simple.py:

importasyncio

frompyinstrumentimportProfiler

asyncdefmain():
p=Profiler()
withp:
print("Hello...")
awaitasyncio.sleep(1)
print("...World!")
p.print()

asyncio.run(main())

復(fù)雜一些的異步代碼分析:

importasyncio
importtime

importpyinstrument

defdo_nothing():
pass

defbusy_wait(duration):
end_time=time.time()+duration

whiletime.time()ifprofile:
p=pyinstrument.Profiler()
p.start()

busy_wait(0.1)
sleep_start=time.time()
awaitasyncio.sleep(when)
print(f"sleptfor{time.time()-sleep_start:.3f}seconds")
busy_wait(0.1)

print(what)
ifprofile:
p.stop()
p.print(show_all=True)

loop=asyncio.get_event_loop()

loop.create_task(say("firsthello",2,profile=True))
loop.create_task(say("secondhello",1,profile=True))
loop.create_task(say("thirdhello",3,profile=True))

loop.run_forever()
loop.close()

工作原理

Pyinstrument 每 1ms 中斷一次程序,并在該點(diǎn)記錄整個(gè)堆棧。它使用 C 擴(kuò)展名和 PyEval_SetProfile 來(lái)做到這一點(diǎn),但只每 1 毫秒讀取一次讀數(shù)。你可能覺(jué)得報(bào)告的樣本數(shù)量有點(diǎn)少,但別擔(dān)心,它不會(huì)降低準(zhǔn)確性。默認(rèn)間隔 1ms 是記錄堆棧幀的下限,但如果在單個(gè)函數(shù)調(diào)用中花費(fèi)了很長(zhǎng)時(shí)間,則會(huì)在該調(diào)用結(jié)束時(shí)進(jìn)行記錄。如此有效地將這些樣本“打包”并在最后記錄。

Pyinstrument 是一個(gè)統(tǒng)計(jì)分析器,并不跟蹤,它不會(huì)跟蹤您的程序進(jìn)行的每個(gè)函數(shù)調(diào)用。相反,它每 1 毫秒記錄一次調(diào)用堆棧。與其他分析器相比,統(tǒng)計(jì)分析器的開(kāi)銷(xiāo)比跟蹤分析器低得多。

比如說(shuō),我想弄清楚為什么 Django 中的 Web 請(qǐng)求很慢。如果我使用 cProfile,我可能會(huì)得到這個(gè):

151940functioncalls(147672primitivecalls)in1.696seconds

Orderedby:cumulativetime

ncallstottimepercallcumtimepercallfilename:lineno(function)
10.0000.0001.6961.696profile:0(at0x1053d6a30,file"./manage.py",line2>)
10.0010.0011.6931.693manage.py:2()
10.0000.0001.5861.586__init__.py:394(execute_from_command_line)
10.0000.0001.5861.586__init__.py:350(execute)
10.0000.0001.1421.142__init__.py:254(fetch_command)
430.0130.0001.1240.026__init__.py:1()
3880.0080.0001.0620.003re.py:226(_compile)
1580.0050.0001.0480.007sre_compile.py:496(compile)
10.0010.0011.0421.042__init__.py:78(get_commands)
1530.0010.0001.0360.007re.py:188(compile)
106/1020.0010.0001.0300.010__init__.py:52(__getattr__)
10.0000.0001.0291.029__init__.py:31(_setup)
10.0000.0001.0211.021__init__.py:57(_configure_logging)
20.0020.0011.0110.505log.py:1()

看完是不是還是一臉懵逼,通常很難理解您自己的代碼如何與這些跟蹤相關(guān)聯(lián)。Pyinstrument 記錄整個(gè)堆棧,因此跟蹤昂貴的調(diào)用要容易得多。它還默認(rèn)隱藏庫(kù)框架,讓您專(zhuān)注于影響性能的應(yīng)用程序/模塊:

_.___/_______/_Recorded:1435Samples:131
/_//_////_///_/////_'///Duration:3.131CPUtime:0.195
/_/v3.0.0b3

Program:examples/django_example/manage.pyrunserver--nothreading--noreload

3.131manage.py:2
└─3.118execute_from_command_linedjango/core/management/__init__.py:378
[473frameshidden]django,socketserver,selectors,wsgi...
2.836selectselectors.py:365
0.126_get_responsedjango/core/handlers/base.py:96
└─0.126hello_worlddjango_example/views.py:4

最后的話

本文分享了 pyinstrument 的用法,有了這個(gè)性能分析神器,以后優(yōu)化代碼可以節(jié)省很多時(shí)間了,這樣的效率神器很值得分享,畢竟人生苦短,能多點(diǎn)時(shí)間干點(diǎn)有意思的不香么?

責(zé)任編輯:haq


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編程
    +關(guān)注

    關(guān)注

    88

    文章

    3634

    瀏覽量

    93855
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4809

    瀏覽量

    68816

原文標(biāo)題:效率神器:快速定位運(yùn)行最慢的代碼

文章出處:【微信號(hào):LinuxHub,微信公眾號(hào):Linux愛(ài)好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電腦相片云存儲(chǔ)位置,如何快速找到電腦相片云存儲(chǔ)位置

    在數(shù)字化時(shí)代,傳統(tǒng)的電腦已經(jīng)無(wú)法滿足我們對(duì)高效、便捷計(jì)算的需求。云電腦以其強(qiáng)大的功能和靈活的使用方式,成為了新時(shí)代的寵兒。今天就為大家介紹如何快速找到電腦相片云存儲(chǔ)位置。 ? ?在現(xiàn)代辦公和生活中
    的頭像 發(fā)表于 01-16 10:44 ?59次閱讀
    電腦相片云存儲(chǔ)位置,如何<b class='flag-5'>快速</b><b class='flag-5'>找到</b>電腦相片云存儲(chǔ)位置

    如何快速入門(mén)HAL庫(kù)編程 HAL庫(kù)與裸機(jī)編程的比較

    如何快速入門(mén)HAL庫(kù)編程快速入門(mén)HAL庫(kù)編程,可以遵循以下步驟: 了解基礎(chǔ)知識(shí) : 掌握C語(yǔ)言編程基礎(chǔ),包括變量、數(shù)據(jù)類(lèi)型、函數(shù)、指針等
    的頭像 發(fā)表于 12-02 11:39 ?376次閱讀

    【「?jìng)}頡編程快速上手」閱讀體驗(yàn)】+初步讀后感

    《倉(cāng)頡編程快速上手》這本書(shū)給我留下了深刻的印象。 首先,書(shū)籍的排布清晰明了,章節(jié)劃分合理,讓人在閱讀過(guò)程中能夠輕松地找到所需內(nèi)容。無(wú)論是按照順序閱讀還是選擇性地查閱特定部分,都十分
    發(fā)表于 09-10 11:09

    【「?jìng)}頡編程快速上手」閱讀體驗(yàn)】+壹讀后感

    清晰透徹,讓你即使沒(méi)有任何編程經(jīng)驗(yàn),也輕松理解。 書(shū)中還配備了大量的實(shí)例和練習(xí),這使得理論知識(shí)不再空洞抽象。通過(guò)實(shí)際操作這些例子,你可以更好地掌握編程的技巧和方法,快速上手
    發(fā)表于 09-06 20:12

    愛(ài)普生產(chǎn)品-低抖動(dòng)溫補(bǔ)可編程晶振

    的晶體振蕩器。由于項(xiàng)目和實(shí)驗(yàn)急迫,怎么才能快速找到合適的晶振呢?很多工程師都遇到過(guò)這樣的問(wèn)題,愛(ài)普生可編程晶振滿足快速交付的急切需求。
    發(fā)表于 08-09 13:55 ?0次下載

    國(guó)內(nèi)低代碼平臺(tái)推薦--萬(wàn)界星空科技低代碼平臺(tái)

    代碼平臺(tái)是一種應(yīng)用程序,它為編程提供圖形用戶(hù)界面,從而以極快的速度開(kāi)發(fā)代碼,減少傳統(tǒng)編程工作。 這些工具有助于快速開(kāi)發(fā)
    的頭像 發(fā)表于 07-18 15:39 ?330次閱讀
    國(guó)內(nèi)低<b class='flag-5'>代碼</b>平臺(tái)推薦--萬(wàn)界星空科技低<b class='flag-5'>代碼</b>平臺(tái)

    運(yùn)動(dòng)控制器的代碼運(yùn)行順序是什么

    組成部分和關(guān)鍵步驟。 初始化 運(yùn)動(dòng)控制器的代碼運(yùn)行順序首先從初始化開(kāi)始。初始化是為控制器設(shè)置初始狀態(tài)的過(guò)程,包括配置輸入/輸出接口、設(shè)置寄存器、初始化變量等。初始化的目的是確保控制器在開(kāi)始執(zhí)行任務(wù)之前處于正確的狀
    的頭像 發(fā)表于 06-13 09:25 ?505次閱讀

    stm32cubeIDE代碼運(yùn)行時(shí)間如何查看?

    stm32cubeIDE 代碼運(yùn)行時(shí)間,如何查看?就如 keil 調(diào)試時(shí)候那樣,可以測(cè)試代碼運(yùn)行時(shí)間。但是在stm32cubeIDE 中,一直沒(méi)有
    發(fā)表于 04-16 08:10

    STM32G070RB部分代碼運(yùn)行是什么原因?qū)е碌模?/a>

    STM32G070RB 部分代碼運(yùn)行 主循環(huán)代碼運(yùn)行一會(huì)就不運(yùn)行了,但定時(shí)器、串口都正常在工作
    發(fā)表于 04-02 06:55

    請(qǐng)問(wèn)STM32IDE如何設(shè)定代碼到ITCM中運(yùn)行?

    近期使用STM32MUX生成STM32IDE的代碼(MCU是STM32H743),目前希望可以將部分代碼定位到ITCM中運(yùn)行,加快處理速度,關(guān)于代碼
    發(fā)表于 03-26 06:08

    關(guān)于STM8S字長(zhǎng)度問(wèn)題和自動(dòng)快速字節(jié)編程問(wèn)題求解

    (1)字長(zhǎng)度問(wèn)題:RM0016文檔 字編程部分介紹1字=4字節(jié),PM0044介紹1字=2字節(jié) (例如LDW指令),因此這兩個(gè)文檔不是矛盾嗎? (2)自動(dòng)快速字節(jié)編程問(wèn)題:上文字節(jié)
    發(fā)表于 03-14 08:24

    在數(shù)控編程中,g代碼的作用是什么

    在數(shù)控編程中,G代碼是一種用于控制數(shù)控機(jī)床運(yùn)動(dòng)和功能的編程語(yǔ)言。它是數(shù)控加工過(guò)程中的重要組成部分,通過(guò)編寫(xiě)G代碼,人們可以靈活地控制數(shù)控機(jī)床
    的頭像 發(fā)表于 02-14 15:53 ?1505次閱讀

    數(shù)控編程的g功能代碼是什么

    數(shù)控編程中,G代碼(也稱(chēng)為指令代碼)是一種用于控制數(shù)控機(jī)床運(yùn)動(dòng)、輔助功能和工作過(guò)程的指令。在數(shù)控編程中,通過(guò)一系列的G代碼指令的組合和排列,
    的頭像 發(fā)表于 02-14 15:51 ?4232次閱讀

    如何快速找到PCB中的GND?

    如何快速找到PCB中的GND?? 在PCB設(shè)計(jì)和制作過(guò)程中,找到地線(GND)是非常關(guān)鍵的步驟。GND是電子電路中一個(gè)非常重要的參考面,它提供了電路中的參考電平,并在電路中提供低噪聲的當(dāng)前路徑。因此
    的頭像 發(fā)表于 02-03 17:04 ?3793次閱讀

    如何在運(yùn)行時(shí)擦除/編程UCB?

    我有一個(gè)項(xiàng)目需要在現(xiàn)場(chǎng)更新 SOTA。 這需要在運(yùn)行時(shí)更新必要的 UCB 值。 我已經(jīng)看過(guò)擦除/編程 PFLASH 和 DFLASH 的示例代碼,但我還沒(méi)有找到任何特定于 UCB 內(nèi)存
    發(fā)表于 01-22 07:18