0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson TX2 將深度學(xué)習(xí)推理提升至兩倍

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Dustin Franklin ? 2022-04-18 15:28 ? 次閱讀

在舊金山的一個 AI 會議上, NVIDIA 發(fā)布了 Jetson TX2 和 Jetpack3 。 0AI SDK 。 Jetson 是世界領(lǐng)先的低功耗嵌入式平臺,為所有邊緣設(shè)備提供服務(wù)器級 AI 計(jì)算性能。 Jetson TX2 具有集成的 256 核 NVIDIA Pascal GPU 、十六進(jìn)制內(nèi)核 ARMv8 64 位 CPU 復(fù)合體和 8GB LPDDR4 內(nèi)存和 128 位接口。 CPU 復(fù)合物結(jié)合了雙核心的丹佛 2 號和四核臂 Cortex-A57 。圖 1 所示的 Jetson TX2 模塊適合于 50 x 87 毫米、 85 克和 7 。 5 瓦的小尺寸、重量和功率(交換)占用空間。

物聯(lián)網(wǎng)IoT )設(shè)備通常充當(dāng)簡單的中繼數(shù)據(jù)網(wǎng)關(guān)。他們依靠云連接來完成繁重的工作和數(shù)字運(yùn)算。邊緣計(jì)算是一種新興的范式,它使用本地計(jì)算來實(shí)現(xiàn)數(shù)據(jù)源的分析。 TX2 具有超過 TFLOP / s 的性能,非常適合將高級人工智能部署到互聯(lián)網(wǎng)連接較差或昂貴的遠(yuǎn)程現(xiàn)場。 Jetson TX2 還為需要任務(wù)關(guān)鍵型自治的智能機(jī)器提供近實(shí)時(shí)響應(yīng)和最小延遲密鑰。

Jetson TX2 基于 16nm NVIDIA Tegra “ Parker ”系統(tǒng)片上系統(tǒng)( SoC )(圖 2 顯示了一個框圖)。 Jetson TX2 在深度學(xué)習(xí)推理方面的能效是其前代產(chǎn)品 Jetson TX1 的兩倍,并提供比 Intel Xeon 服務(wù)器 CPU 更高的性能。效率的提高重新定義了將先進(jìn)的人工智能從云端擴(kuò)展到邊緣的可能性。

poYBAGJdEzyAQ2u2AAJOzmrvsFg324.png

圖 2 : NVIDIA Jetson TX2 Tegra “ Parker ” SoC 框圖,具有集成的 NVIDIA Pascal GPU 、 NVIDIA Denver 2 + Arm Cortex-A57 CPU 集群和多媒體加速引擎(點(diǎn)擊圖片獲取完整分辨率)。

Jetson TX2 有多個多媒體流引擎,通過減輕傳感器采集和分發(fā)的負(fù)擔(dān),使其 Pascal GPU 能夠獲得數(shù)據(jù)。這些多媒體引擎包括六個專用的 MIPI CSI-2 攝像頭端口,每通道提供高達(dá) 2 。 5gb / s 的帶寬和 1 。 4gb / s 的雙圖像服務(wù)處理器( ISP )處理,以及支持 H 。 265 、每秒 4k60 幀的視頻編解碼器。

Jetson TX2 使用 NVIDIA cuDNN 和 TensorRT 庫加速尖端深度神經(jīng)網(wǎng)絡(luò)( DNN )架構(gòu),并支持 遞歸神經(jīng)網(wǎng)絡(luò) 、 長短期記憶網(wǎng)絡(luò) 和在線 強(qiáng)化學(xué)習(xí) 。它的雙 CAN 總線控制器使自動駕駛儀集成到控制機(jī)器人無人機(jī),這些機(jī)器人和無人機(jī)使用 DNN 感知周圍的世界,并在動態(tài)環(huán)境中安全運(yùn)行。 Jetson TX2 的軟件通過 NVIDIA 的 噴氣背包 3 。 0 和 Linux for Tegra ( L4T ) Board Support Package ( BSP )提供。

表 1 比較了 Jetson TX2 與上一代 Jetson TX1 的特性。

pYYBAGJdE62AGVs7AACY8YBXOlw462.png

兩倍的性能,兩倍的效率

在我的 在 JetPack 2 。 3 上發(fā)布 中,我演示了 NVIDIA TensorRT 如何提高 Jetson TX1 深度學(xué)習(xí)推理性能,效率比桌面類 CPU 高 18 倍。 TensorRT 通過使用 graph 優(yōu)化、內(nèi)核融合、 半精度浮點(diǎn)計(jì)算( FP16 ) 和架構(gòu)自動調(diào)整來優(yōu)化生產(chǎn)網(wǎng)絡(luò)以顯著提高性能。除了利用 Jetson TX2 對 FP16 的硬件支持之外, NVIDIA TensorRT 還能夠批量同時(shí)處理多個圖像,從而獲得更高的性能。

Jetson TX2 和 JetPack 3 。 0 將 Jetson 平臺的性能和效率提升到一個全新的水平,為用戶提供了在 AI 應(yīng)用中獲得兩倍或最多兩倍于 Jetson TX1 性能的選項(xiàng)。這種獨(dú)特的功能使 Jetson TX2 成為邊緣需要高效人工智能的產(chǎn)品和邊緣附近需要高性能的產(chǎn)品的理想選擇。 Jetson TX2 還與 Jetson TX1 兼容,為使用 Jetson TX1 設(shè)計(jì)的產(chǎn)品提供了一個簡單的升級機(jī)會。

為了測試 Jetson TX2 和 JetPack 3 。 0 的性能,我們將其與服務(wù)器類 CPU 、 Intel Xeon E5-2690 v4 進(jìn)行比較,并使用 GoogLeNet 深度圖像識別網(wǎng)絡(luò)測量深度學(xué)習(xí)推理吞吐量(每秒圖像數(shù))。如圖 3 所示, Jetson TX2 在低于 15W 的功率下運(yùn)行的性能優(yōu)于在接近 200W 的情況下運(yùn)行的 CPU ,從而使數(shù)據(jù)中心級的 AI 能力處于邊緣。

poYBAGJdEz-APgw6AAChtuZrAj4811.png

圖 3 : GoogLeNet 網(wǎng)絡(luò)架構(gòu)在 NVIDIA Jetson TX2 和 Intel Xeon E5-2960 v4 上的性能。

Jetson TX2 的卓越 AI 性能和效率源于新的 Pascal GPU 架構(gòu)和動態(tài)能量配置文件( Max-Q 和 Max-P )、 JetPack 3 。 0 附帶的優(yōu)化深度學(xué)習(xí)庫以及大內(nèi)存帶寬的可用性。

Max-Q 和 Max-P

Jetson TX2 設(shè)計(jì)用于 7 。 5W 功率下的峰值處理效率。這一性能水平被稱為 Max-Q ,代表功率/吞吐量曲線的峰值。模塊上的每個組件(包括電源)都經(jīng)過優(yōu)化,以提供最高的效率。 GPU 的最大 Q 頻率為 854 MHz ,而 Arm A57 CPU 的最大 Q 頻率為 1 。 2 GHz 。 JetPack 3 。 0 中的 L4T BSP 包括用于將 Jetson TX2 設(shè)置為 Max-Q 模式的預(yù)設(shè)平臺配置。 Jetpack3 。 0 還包括一個名為 nvpmodel 的新命令行工具,用于在運(yùn)行時(shí)切換配置文件。

雖然動態(tài)電壓和頻率縮放( DVFS )允許 Jetson TX2 的 Tegra “ Parker ” SoC 在運(yùn)行時(shí)根據(jù)用戶負(fù)載和功耗調(diào)整時(shí)鐘速度,但 Max-Q 配置設(shè)置了時(shí)鐘上限,以確保應(yīng)用程序僅在最有效的范圍內(nèi)運(yùn)行。表 2 顯示了在運(yùn)行 GoogLeNet 和 AlexNet 深度學(xué)習(xí)基準(zhǔn)測試時(shí), Jetson TX2 和 Jetson TX1 的性能和能效。在 Max-Q 模式下運(yùn)行的 Jetson TX2 的性能與在最大時(shí)鐘頻率下運(yùn)行的 Jetson TX1 的性能相似,但只消耗一半的功率,因此能量效率提高了一倍。

盡管功率預(yù)算有限的大多數(shù)平臺將從 Max-Q 行為中受益最大,但其他平臺可能更喜歡使用最大時(shí)鐘來達(dá)到峰值吞吐量,盡管這樣做會導(dǎo)致更高的功耗和更低的效率。 DVFS 可以配置為在其他時(shí)鐘速度范圍內(nèi)運(yùn)行,包括欠時(shí)鐘和超頻。 Max-P 是另一種預(yù)設(shè)平臺配置,可在不到 15W 的時(shí)間內(nèi)實(shí)現(xiàn)最大系統(tǒng)性能。啟用 Arm A57 群集或啟用丹佛 2 群集時(shí), GPU 的 Max-P 頻率為 1122 MHz , CPU 的 Max-P 頻率為 2 GHz ,當(dāng)兩個群集都啟用時(shí), Max-P 頻率為 1 。 4 GHz 。您還可以創(chuàng)建具有中頻目標(biāo)的自定義平臺配置,以便在應(yīng)用程序的峰值效率和峰值性能之間實(shí)現(xiàn)平衡。下表 2 顯示了從 Max-Q 到 Max-P 的性能如何提高,以及如何在效率逐漸降低的情況下提高 GPU 時(shí)鐘頻率。

poYBAGJdE7qAPel9AABugosIZ44992.png

Jetson TX2 執(zhí)行 GoogLeNet 推理的速度高達(dá) 33 。 2 圖像/秒/瓦,幾乎是 Jetson TX1 的兩倍,效率比 Intel Xeon 高出近 20 倍。

端到端人工智能應(yīng)用

兩個 Pascal 流式多處理器( SMs )是 Jetson TX2 高效性能的重要組成部分,每個處理器有 128 個 CUDA 核。 Pascal GPU 架構(gòu) 提供了重大的性能改進(jìn)和電源優(yōu)化。 TX2 的 CPU 復(fù)合體包括雙核 7 路超標(biāo)量 NVIDIA Denver 2 ,用于動態(tài)代碼優(yōu)化的高單線程性能,以及用于多線程處理的四核 Arm Cortex-A57 。

相干的丹佛 2 和 A57 CPU 都有一個 2MB 的二級緩存,并通過由 NVIDIA 設(shè)計(jì)的高性能互連結(jié)構(gòu)進(jìn)行連接,以在異構(gòu)多處理器( HMP )環(huán)境中實(shí)現(xiàn)兩個 CPU 的同時(shí)操作。一致性機(jī)制允許根據(jù)動態(tài)性能需求自由地對任務(wù)進(jìn)行 MIG 評級,以減少開銷的方式有效地利用 CPU 核心之間的資源。

Jetson TX2 是自主機(jī)端到端 AI 管線的理想平臺。 Jetson 有線傳輸實(shí)時(shí)高帶寬數(shù)據(jù):在處理 GPU 數(shù)據(jù)后,可同時(shí)接收多個傳感器的數(shù)據(jù),執(zhí)行媒體解碼/編碼、組網(wǎng)和低級命令控制協(xié)議。圖 4 顯示了使用高速接口陣列(包括 CSI 、 PCIe 、 USB3 和千兆以太網(wǎng))連接傳感器的常見管道配置。 CUDA 預(yù)處理和后處理階段通常包括色域轉(zhuǎn)換(成像 DNN 通常使用 BGR 平面格式)和對網(wǎng)絡(luò)輸出的統(tǒng)計(jì)分析。

Jetson_AI_pipeline-1-624x194.png

圖 4 :端到端人工智能管道,包括傳感器采集、處理、指揮和控制。

由于內(nèi)存和帶寬是 Jetson TX1 的兩倍, Jetson TX2 能夠同時(shí)捕獲和處理額外的高帶寬數(shù)據(jù)流,包括立體攝像機(jī)和 4K 超高清輸入和輸出。通過管道,深度學(xué)習(xí)和計(jì)算機(jī)視覺將來自不同來源和光譜域的多個傳感器融合在一起,從而增強(qiáng)了自動導(dǎo)航期間的感知能力和態(tài)勢感知能力。

Jetson TX2 開發(fā)工具包入門

首先, NVIDIA 為 Jetson TX2 開發(fā)工具包 提供了一個參考的小型 ITX 載體板( 170 毫米 x 170 毫米)和一個 500 萬像素的 MIPI CSI-2 相機(jī)模塊。開發(fā)工具包包括文檔和設(shè)計(jì)示意圖以及 JetPack-L4T 的免費(fèi)軟件更新。圖 5 顯示了開發(fā)工具包,顯示了 Jetson TX2 模塊和標(biāo)準(zhǔn) PC 連接,包括 USB3 、 HDMIRJ45 千兆以太網(wǎng)、 SD 卡和 PCIe x4 插槽,這使得 Jetson 的應(yīng)用程序開發(fā)更加容易。

要超越開發(fā)到定制部署平臺,您可以修改開發(fā)工具包載體板和相機(jī)模塊的參考設(shè)計(jì)文件,以創(chuàng)建自定義設(shè)計(jì)?;蛘撸?Jetson 生態(tài)系統(tǒng)合作伙伴為部署 Jetson TX1 和 Jetson TX2 模塊提供現(xiàn)成的解決方案,包括微型載體、外殼和攝像頭。 NVIDIA Developer Forums 為 Jetson 建造者和 NVIDIA 工程師社區(qū)提供技術(shù)支持和協(xié)作之家。表 3 列出了主要文件和有用的資源。

poYBAGJdE8SAUXWJAAA5rH9heu8876.png

Jetson TX2 開發(fā)工具包可通過 NVIDIA 在線商店 以 599 美元的價(jià)格預(yù)訂。 3 月 14 日開始在北美和歐洲發(fā)貨,其他地區(qū)也將陸續(xù)發(fā)貨。 Jetson TX2 教育折扣 還提供: 299 美元用于學(xué)術(shù)機(jī)構(gòu)的附屬機(jī)構(gòu)。 NVIDIA 已將 Jetson TX1 開發(fā)工具包的價(jià)格降至 499 美元。

JetPack 3 。 0 SDK 開發(fā)包

最新的 NVIDIA JetPack 3.0 支持 Jetson TX2 使用業(yè)界領(lǐng)先的 AI 開發(fā)工具和硬件加速 API(見表4),包括 NVIDIA CUDA 工具包版本8.0、cuDNN、TensorRT、VisionWorks、GStreamer 和 OpenCV,這些都是在 Linux 內(nèi)核v4.4、L4T R27.1 BSP 和 Ubuntu 16.04 LTS 的基礎(chǔ)上構(gòu)建的。Jetpack3.0 包括用于交互式分析和調(diào)試的Tegra系統(tǒng)探查器和Tegra圖形調(diào)試器工具。Tegra多媒體API包括低級攝像頭捕獲和Video4Linux2(V4L2)編解碼器接口。在閃爍的同時(shí),JetPack會自動使用所選的軟件組件配置Jetson TX2,從而實(shí)現(xiàn)開箱即用的完整環(huán)境

poYBAGJdE82ASsWTAAAuWmm39k8813.png

Jetson 是一個高性能的嵌入式解決方案,用于部署 Caffe 、 Torch 、 Theano 和 TensorFlow 等深度學(xué)習(xí)框架。這些和許多其他深度學(xué)習(xí)框架已經(jīng)將 NVIDIA 的 cuDNN 庫與 GPU 加速集成在一起,并且只需要很少的 MIG 定量工作就可以在 Jetson 上部署。 KZV3 的軟件和應(yīng)用程序通常在云計(jì)算中心和服務(wù)器上無縫部署[KZV3]軟件和應(yīng)用程序。

還有兩天就要演示了

NVIDIA Two Days to a Demo 是一個幫助任何人開始部署深度學(xué)習(xí)的倡議。 NVIDIA 提供計(jì)算機(jī)視覺原語,包括圖像識別、目標(biāo)檢測+定位和分割,以及用 DIGITS 訓(xùn)練的 神經(jīng)網(wǎng)絡(luò) 模型。您可以將這些網(wǎng)絡(luò)模型部署到 Jetson 上,以便使用 NVIDIA TensorRT 進(jìn)行有效的深度學(xué)習(xí)推斷?!皟商煲粋€演示”提供了示例流式應(yīng)用程序,以幫助您體驗(yàn)實(shí)時(shí)攝像頭提要和真實(shí)世界的數(shù)據(jù)。

兩天的演示代碼是 在 GitHub 上提供 ,以及易于遵循的測試和重新訓(xùn)練網(wǎng)絡(luò)模型的分步指導(dǎo),為您的定制主題擴(kuò)展了視覺原語。這些教程演示了數(shù)字工作流的強(qiáng)大概念,向您展示了如何在云端或 PC 機(jī)上迭代地訓(xùn)練網(wǎng)絡(luò)模型,然后將其部署到 Jetson 上進(jìn)行運(yùn)行時(shí)推斷和進(jìn)一步的數(shù)據(jù)收集。

通過使用預(yù)先訓(xùn)練的網(wǎng)絡(luò)和轉(zhuǎn)移學(xué)習(xí),此工作流使您可以輕松地使用自定義對象類來定制基礎(chǔ)網(wǎng)絡(luò)以滿足您的任務(wù)。一旦一個特定的網(wǎng)絡(luò)體系結(jié)構(gòu)被證明適用于某個原語或應(yīng)用程序,那么針對特定的用戶定義的應(yīng)用程序(例如包含新對象的訓(xùn)練數(shù)據(jù))對其進(jìn)行重新調(diào)整或重新訓(xùn)練通常會非常容易。

正如在 這個平行的 博客文章中所討論的, NVIDIA 在數(shù)字 5 上增加了對分段網(wǎng)絡(luò)的支持,現(xiàn)在可以在 Jetson TX2 上使用,演示時(shí)間為兩天。分割原語使用完全卷積 Alexnet 架構(gòu)( FCN-Alexnet )對視野中的單個像素進(jìn)行分類。由于分類發(fā)生在像素級,與圖像識別中的圖像級不同,分割模型能夠提取對周圍環(huán)境的全面了解。這克服了自主導(dǎo)航機(jī)器人和無人機(jī)所面臨的重大障礙,這些機(jī)器人和無人機(jī)可以直接使用分割區(qū)域進(jìn)行路徑規(guī)劃和障礙物回避。

分段制導(dǎo)的自由空間探測使地面車輛能夠安全地在地面上導(dǎo)航,而無人機(jī)則通過視覺識別和跟蹤地平線和天空平面,以避免與障礙物和地形發(fā)生碰撞。感知和避免功能是智能機(jī)器與環(huán)境安全交互的關(guān)鍵。在 Jetson TX2 上使用 TensorRT 處理要求計(jì)算量大的分段網(wǎng)絡(luò),對于避免事故所需的低響應(yīng)延遲至關(guān)重要。

兩天的演示包括一個使用 FCN Alexnet 的空中分割模型(圖 7 ),以及相應(yīng)的 horizon 第一人稱視圖( FPV )數(shù)據(jù)集??罩蟹指钅P涂勺鳛闊o人機(jī)和自主導(dǎo)航的范例。您可以使用自定義數(shù)據(jù)輕松擴(kuò)展模型,以識別用戶定義的類,如著陸平臺和工業(yè)設(shè)備。一旦以這種方式增強(qiáng),你就可以把它部署到裝備了 Jetson 的無人機(jī)上,比如 Teal 和 Aerialtronics 的無人機(jī)。

為了鼓勵開發(fā)更多的自主飛行控制模式,我在 GitHub 上發(fā)布了空中訓(xùn)練數(shù)據(jù)集、分段模型和工具。 NVIDIA Jetson TX2 和 Two Days to a Demo 使在該領(lǐng)域開始使用先進(jìn)的深度學(xué)習(xí)解決方案比以往任何時(shí)候都更容易。

Jetson 生態(tài)系統(tǒng)

Jetson TX2 的模塊化外形使其能夠部署到各種環(huán)境和場景中。 NVIDIA 的開源參考載波設(shè)計(jì)來自于 Jetson TX2 開發(fā)工具包,為縮小或修改單個項(xiàng)目需求的設(shè)計(jì)提供了一個起點(diǎn)。一些小型化的載體與 Jetson 模塊本身具有相同的 50x87mm 的占地面積,從而實(shí)現(xiàn)了緊湊的組裝,如圖 8 所示。使用 NVIDIA 提供的文檔和設(shè)計(jì)輔助資料,或嘗試現(xiàn)成的解決方案。今年 4 月, NVIDIA 將推出 Jetson TX1 和 TX2 模塊,價(jià)格分別為 299 美元和 399 美元,數(shù)量為 1000 臺或更多。

pYYBAGJdE2eAVBIHAAB7ox4ip3g770.png

圖 8 : ConnectTech

Sprocket

緊湊型托架組件,適用于 Jetson TX2 和 Jetson TX1 ,售價(jià) 99 美元。

生態(tài)系統(tǒng)合作伙伴{ ConnectTech ? Auvidea ?提供與 Jetson TX1 和 TX2 共享插座兼容的可部署微型載體和外殼,如圖 8 所示。 Image partners & 豹紋成像 ? 山脊跑 提供攝像頭和多媒體支持。加固專家 阿巴科系統(tǒng) ↓ 沃爾夫先進(jìn)技術(shù) ?為在惡劣環(huán)境下操作提供 MIL 規(guī)范的資質(zhì)。

除了用于部署到野外的緊湊型載體和外殼外, Jetson 的生態(tài)系統(tǒng)覆蓋范圍超出了典型的嵌入式應(yīng)用。 Jetson TX2 的多核 Arm / GPU 體系結(jié)構(gòu)和卓越的計(jì)算效率也讓高性能計(jì)算( HPC )行業(yè)備受關(guān)注。高密度 1U 機(jī)架式服務(wù)器現(xiàn)已提供萬兆以太網(wǎng)和多達(dá) 24 個 Jetson 模塊。圖 9 顯示了一個可伸縮陣列服務(wù)器的示例。 Jetson 的低功耗和被動冷卻對于輕量級、可擴(kuò)展的云任務(wù)(包括低功耗的 web 服務(wù)器、多媒體處理和分布式計(jì)算)很有吸引力。視頻分析和代碼轉(zhuǎn)換后端通常與部署在現(xiàn)場的智能攝像機(jī)和物聯(lián)網(wǎng)設(shè)備上的 Jetson 配合工作,可以從 Jetson TX2 增加的每個處理器支持的同步數(shù)據(jù)流和視頻編解碼器的比率中獲益。

AI 在邊緣

Jetson TX2 無與倫比的嵌入式計(jì)算能力將尖端 DNN 和下一代人工智能帶到板上邊緣設(shè)備上。 Jetson TX2 提供服務(wù)器級的高能效性能。它的原始深度學(xué)習(xí)性能比 Intel Xeon 高出 1 。 25 倍,計(jì)算效率提高了近 20 倍。 Jetson 緊湊的占地面積、計(jì)算能力和具有深度學(xué)習(xí)功能的 JetPack 軟件堆棧使開發(fā)人員能夠使用 AI 解決 21 世紀(jì)的挑戰(zhàn)。

關(guān)于作者

Dustin Franklin 是 NVIDIA 的 Jetson 團(tuán)隊(duì)的開發(fā)人員布道者。 Dustin 擁有機(jī)器人和嵌入式系統(tǒng)方面的背景,他樂于在社區(qū)中提供幫助,并與 Jetson 一起參與項(xiàng)目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5088

    文章

    19159

    瀏覽量

    306509
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47525

    瀏覽量

    239257
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5510

    瀏覽量

    121349
收藏 人收藏

    評論

    相關(guān)推薦

    ADS1230放大為什么只有兩倍?

    ADS1230放大只有兩倍,(PIN5和PIN6端的電壓) / (輸入電壓) =2,采集的值也是放大兩倍的值,通訊是正常的。
    發(fā)表于 01-08 08:11

    智譜GLM-Zero深度推理模型預(yù)覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型,標(biāo)志著智譜在AI
    的頭像 發(fā)表于 01-02 10:55 ?144次閱讀

    NVIDIA 推出高性價(jià)比的生成式 AI 超級計(jì)算機(jī)

    Jetson Orin Nano Super 可將生成式 AI 性能提升至1.7 ,支持科技愛好者、開發(fā)者和學(xué)生使用的主流模型。 ? ? NVIDIA 推出了一款全新的尺寸小巧的生成
    發(fā)表于 12-18 17:01 ?444次閱讀
    <b class='flag-5'>NVIDIA</b> 推出高性價(jià)比的生成式 AI 超級計(jì)算機(jī)

    谷歌正式發(fā)布Gemini 2.0 性能提升兩倍

    2.0在關(guān)鍵基準(zhǔn)測試中相比前代產(chǎn)品Gemini 1.5 Pro的性能提升了近兩倍。該模型支持圖像、視頻和音頻等多種輸入與輸出形式,例如可以實(shí)現(xiàn)文本與圖像的混合生成以及自定義的多語言文本轉(zhuǎn)語音(TTS)內(nèi)容。 此外,Gemini 2.0還支持直接調(diào)用工具如Google搜索
    的頭像 發(fā)表于 12-12 14:22 ?358次閱讀

    初創(chuàng)公司借助NVIDIA Metropolis和Jetson提高生產(chǎn)線效率

    初創(chuàng)公司使用 NVIDIA Metropolis 視覺 AI 和 Jetson 邊緣 AI 平臺提高生產(chǎn)線效率。
    的頭像 發(fā)表于 11-19 14:39 ?226次閱讀

    使用NVIDIA Jetson打造機(jī)器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠(yuǎn)見的高中生。她使用機(jī)器學(xué)習(xí)NVIDIA Jetson邊緣 AI 和機(jī)器人平臺,為視障人士打造了機(jī)器人導(dǎo)盲犬。
    的頭像 發(fā)表于 11-09 13:51 ?288次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :
    的頭像 發(fā)表于 10-23 15:25 ?1034次閱讀

    OPA842的datasheet里面單位增益帶寬是增益帶寬積的兩倍,為什么?

    目前我參考的所有資料都說是對于decompensated op amp,單位增益帶寬小于增益帶寬積,但是OPA842的datasheet里面卻是單位增益帶寬是增益帶寬積的兩倍,不知道這是為什么?
    發(fā)表于 09-05 07:18

    深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

    深度學(xué)習(xí)編譯器和推理引擎在人工智能領(lǐng)域中都扮演著至關(guān)重要的角色,但它們各自的功能、應(yīng)用場景以及優(yōu)化目標(biāo)等方面存在顯著的差異。以下是對者區(qū)別的詳細(xì)探討。
    的頭像 發(fā)表于 07-17 18:12 ?1305次閱讀

    如何在tx2部署模型

    在本文中,我們詳細(xì)介紹如何在NVIDIA Jetson TX2上部署深度學(xué)習(xí)模型。
    的頭像 發(fā)表于 07-09 10:16 ?628次閱讀

    Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的兩倍

    Anthropic 發(fā)布Claude 3.5 Sonnet最新模型 新模型在推理、知識和編碼能力評估方面超越了以前的版本和競爭對手GPT 4o模型,同時(shí)其運(yùn)行速度是Claude 3 Opus的兩倍
    的頭像 發(fā)表于 06-21 15:43 ?857次閱讀
    Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的<b class='flag-5'>兩倍</b>

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理器管理Wi-Fi如何解決?

    我們使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,請參閱 Nvidia Jetson
    發(fā)表于 05-23 06:47

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    ,推理能力提升 15 GB200由個B200Blackwell GPU和一個基于Arm的Grace CPU組成,采用[臺積電]4納米工藝制程,共有2080億個[晶體管],其AI性
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)
    的頭像 發(fā)表于 04-20 09:39 ?777次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或取代GPU

    現(xiàn)場可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時(shí)面臨的許多問題 在過去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價(jià)也大幅
    發(fā)表于 03-21 15:19