基于DINO知識蒸餾架構的分層級聯(lián)Transformer網(wǎng)絡

來自復旦大學、上海市智能信息處理重點實驗室和香港大學的研究者提出了一種基于 DINO 知識蒸餾架構的分層級聯(lián) Transformer (HCTransformer) 網(wǎng)絡。

小樣本學習是指從非常少量的標記數(shù)據(jù)中進行學習的問題，它有望降低標記成本，實現(xiàn)低成本、快速的模型部署，縮小人類智能與機器模型之間的差距。小樣本學習的關鍵問題是如何高效地利用隱藏在標注數(shù)據(jù)中的豐富信息中進行學習。近年來，視覺 Transformer (ViT [1]) 作為計算機視覺領域的新興架構，因其在很多主流任務中都取得了反超 CNN 的表現(xiàn)而受到廣泛關注。我們注意到 ViT 在訓練時易于陷入過擬合的狀態(tài)而表現(xiàn)出較差的性能，現(xiàn)有的研究大部分關注其在大、中型數(shù)據(jù)集上的表現(xiàn)，而幾乎沒有將其應用于針對更加敏感于過擬合的小樣本任務上的相關研究。 ?

為了緩解這一問題，提高小數(shù)據(jù)集下數(shù)據(jù)的利用效率，來自復旦大學、上海市智能信息處理重點實驗室和香港大學的研究者提出了一種基于 DINO [2] 知識蒸餾架構的分層級聯(lián) Transformer (HCTransformer) 網(wǎng)絡，通過譜聚類 tokens 池化以利用圖像的內(nèi)在結構來減少前景內(nèi)容和背景噪聲的模糊性，同時也提供了對不同數(shù)據(jù)集對于 patch token 切分大小的不同需求的適用性選擇；并利用一種非傳統(tǒng)的監(jiān)督方式，通過標簽的潛在屬性在圖像標簽中找到更豐富的視覺信息，而非簡單地學習由標簽分類的視覺概念。實驗表明，本文的方法在各個流行的 Few-Shot Classification 數(shù)據(jù)集上均取得了 SOTA 性能。 ?

論文鏈接：https://arxiv.org/abs/2203.09064

代碼鏈接：https://github.com/StomachCold/HCTransformers

目前，這項研究已被 CVPR2022 接收，完整訓練代碼及模型已經(jīng)開源。 ? 方法

圖 1：方法整體架構。包括三個級聯(lián)的 Transformer 網(wǎng)絡，每一階段都是一個 te acher-student 的知識蒸餾結構。 ? DINO 自監(jiān)督架構 ? DINO 是一種基于知識蒸餾架構的自監(jiān)督網(wǎng)絡，和 BYOL [3] 類似，但 DINO 使用 Transformer 代替了 BYOL 中的 CNN。其中 Student 模型和 Teacher 模型的結構是完全一樣的。 ? 在訓練過程中，Teacher 模型并不通過輸入來更新參數(shù)，它的權重更新是通過對 Student 模型權重的 EMA（exponential moving average ）來更新的。此外，Teacher 和 Student 都有獨立的數(shù)據(jù)增強方式。在這種設定下，整個網(wǎng)絡會把 Teacher 網(wǎng)絡的輸出當作是 Student 網(wǎng)絡的標簽，從而指導全局更新。因為網(wǎng)絡沒有直接使用圖片的類別標簽，所以可以支持使用較高維度的特征（如 65536）而不必局限于圖像的類別數(shù)量，使得網(wǎng)絡可以學習到更加細膩的特征表示。但在自監(jiān)督的架構下，由于小樣本學習的數(shù)據(jù)集較小，直接應用 DINO 進行訓練很難取得較好的效果。 ?

屬性代理監(jiān)督

基于這一前提，本文設法將 DINO 改成有監(jiān)督模型，但 Transformer 在小數(shù)據(jù)集上直接使用 one-hot 向量作為標簽，不僅需要將網(wǎng)絡輸出維度改成圖片類別數(shù)導致學習相對粗糙，而且會產(chǎn)生較嚴重的過擬合現(xiàn)象。因此，本文針對小樣本任務，為 Transformer 設計了一種屬性代理監(jiān)督的傳播方案，以避免傳統(tǒng)監(jiān)督帶來的局限性。 ? 具體來說，對于標簽空間中的每個視覺概念 y，我們的目標是為其學習一個語義屬性的代理向量，進而使同一個標簽的輸出均向這個代理向量在向量空間中靠攏，也同時影響到該代理向量的更新。其中，y 是輸入數(shù)據(jù)的標簽，D' 是整個網(wǎng)絡的輸出維度。 ?

在 Transformer 中，輸入圖片在通過 Encoder 后會得到一個 class token 和 N 個 patch tokens。一般來說在分類任務中，只會單一使用某一種token作為最終輸出結果進行監(jiān)督，而丟棄另一種token。相較于傳統(tǒng)設計，本文將 class token 和 patch tokens 同時都用于監(jiān)督，以更大限度提高數(shù)據(jù)利用率。

Class Token 監(jiān)督

圖片輸入到 DINO 網(wǎng)絡中，會經(jīng)過 encoder 后生成一個 class token 和 N 個的 patch tokens，之后 class token 再通過一個 MLP 得到最終的輸出。不同于傳統(tǒng)監(jiān)督方式，由于 DINO 本身的自監(jiān)督設計，導致最終的輸出并不是一個 one-hot 向量，而是一個更高維度的向量。因此我們?yōu)槊恳粋€標簽設計了一個維度的可學習向量作為該類別的代理屬性，通過 KL 散度將同一標簽的輸出聚攏。

在公式 1 中，是 student 網(wǎng)絡中的 class token 經(jīng)過 MLP 的最終輸出，是該標簽對應的語義屬性代理向量。為 KL 散度計算。 ? Patch Tokens 監(jiān)督 ? 在 Transformer 中，由于缺少 patch 級別的標簽信息，patch tokens 一般很難與 class token 同時用來監(jiān)督網(wǎng)絡。為了對 patch tokens 進行監(jiān)督，我們把 N 個 patch tokens 用經(jīng)過 softmax 操作后的注意力矩陣進行加權合并計算，得到一個全局 token，然后采用和 class token 相同的監(jiān)督方式對該全局 token 進行監(jiān)督。 ?

其中，為 class token 對其他 patch tokens 的注意力矩陣，是 encoder 后輸出的 patch tokens，為加權合并后的全局 token。 ?

公式 3 與公式 1 采用相同的策略。 ? 譜聚類 tokens 池化 ? 許多工作, 如 GroupFPN [4] 和 GLOM [5] 都證明了多尺度層次結構對 CNN 和 Transformer 都有效。本文的設計目的是為了將層次結構嵌入到 Transformer 中來提高網(wǎng)絡對特征的判別能力。與 Swin Transformer [4] 使用固定的網(wǎng)格池化方案不同，本文利用不規(guī)則網(wǎng)格池化方法來更靈活地匹配圖像結構。由于 Transformer 將在 tokens 之間生成自注意力矩陣，因此它為譜聚類算法 [5] 提供了強大的先驗經(jīng)驗，以根據(jù)語義相似性和空間布局對 tokens 進行分割合并。因此我們提出了一種基于譜聚類的池化方法，稱為譜聚類 tokens 池化。 ? 為了保持各 patch 之間原有的位置關系信息，本文對于 ViT 中的 N 個 patch tokens 之間的注意力矩陣加上了鄰接限制，使每個 patch 只和相鄰的 8 個 patch 有相似性。 ?

其中，A_p 是 patch tokens 的注意力矩陣，H 是包含位置信息的鄰接矩陣。然后我們對 S 矩陣做一個 softmax 操作得到我們最終需要的 S' 矩陣作為譜聚類 tokens 池化的輸入。 ?

如上算法所示，每一次池化后我們將得到同類聚類數(shù)量減半的新 tokens。 ? 在本文的網(wǎng)絡設計中，訓練階段首先會訓練第一階段的 Transformer 網(wǎng)絡來得到一個有較好表征能力的特征生成器，隨后再引入池化操作，加上二三階段 Transformer 共同訓練。最終在三階段中通過驗證集挑選出最優(yōu)結果作為最終輸出。 ?

圖 2：譜聚類池化的可視化圖 ?

實驗結果

我們分別在四個流行的 Few-Shot Classification 數(shù)據(jù)集：mini-Imagenet, tiered-Imagenet, CIFAR-FS 和 FC100 上做了詳盡的實驗。 ?

最終結果如表 1,2,3 所示：相比于現(xiàn)有的 SOTA 模型，HCTransformers 在 1-shot 和 5-shot 的結果上都顯示出明顯的性能優(yōu)勢。例如，如表 1 所示，在 miniImagnet 上，HCTransformers 比最優(yōu) SOTA 結果分別高出 5.37%(1-shot) 和 4.03%(5-shot)。在 tieredImagenet 上，我們的方法在 1-shot 和 5-shot 上的表現(xiàn)分別比最好的 DC [6] 方法高出 1.48% 和 1.81%。與 DC 相比，我們不需要從 base 訓練集中借用類某類圖像的統(tǒng)計信息，并且使用更輕量級的分類器。此外，我們的方法和第三好的方法之間的差距是 5.09%，這也進一步驗證了我們的貢獻。 ? 這樣令人印象深刻的結果要歸功于我們的網(wǎng)絡結構，它能學習到數(shù)據(jù)中固有的內(nèi)在信息，并具有良好的泛化能力。表 2 和表 3 分別顯示了在小分辨率數(shù)據(jù)集 CIFAR-FS 和 FC100 上的結果。HCTransformers 在這些低分辨率設置中顯示出和 SOTA 類似或更好的結果: 在 CIFAR-FS 上提高了 1.02%(1-shot) 和 0.76%(5-shot); 在 FC100 上提高了 0.51%(1-shot) 和 1.12%(5-shot)。在小分辨率數(shù)據(jù)集上，我們并沒有超越以前的 SOTA 方法很多，我們將其歸因于 ViT 的 patch 機制：當圖像分辨率較小時，如 32*32，每一個 patch 所包含的實際像素過少，很難提取出有用的特征表示。DeepEMD [7] 的實驗也佐證了 patch cropping 會對小分辨率圖像產(chǎn)生負面影響。即便如此，我們的方法仍然在這兩個基準上都取得了新的 SOTA 結果。 ?
參考文獻
[1]. Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov,Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner,Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, and Neil Houlsby. An imageis worth 16x16 words: Transformers for image recognition at scale. In 9th International Conference on Learning Representations, ICLR 2021, Virtual Event, Austria, May 3-7, 2021.OpenReview.net,2021. 1, 2, 3, 7, 8
[2]. Mathilde Caron, Hugo Touvron, Ishan Misra, Herv′e J′egou, Julien Mairal, Piotr Bojanowski, and Armand Joulin. Emerging properties in self-supervised vision transformers. arXiv preprint arXiv:2104.14294, 2021. 3, 5
[3]. Jean-Bastien Grill, Florian Strub, Florent Altch′e, Corentin Tallec, Pierre H.Richemond, Elena Buchatskaya, Carl Doersch, Bernardo ′Avila Pires, Zhaohan Guo, Mohammad Gheshlaghi Azar, Bilal Piot, Koray Kavukcuoglu, R′emi Munos, and Michal Valko. Bootstrap your own latent-A new approach to self-supervised learning. In Hugo Larochelle, Marc’Aurelio Ranzato, Raia Hadsell, Maria- Florina Balcan, and Hsuan-Tien Lin, editors, Advances in Neural Information Processing Systems 33: Annual Conference on Neural Information Processing Systems 2020, NeurIPS 2020, December 6-12, 2020, virtual, 2020. 3
[4]. Gangming Zhao, Weifeng Ge, and Yizhou Yu. Graphfpn:Graph feature pyramid network for object detection. In Proceedings of the IEEE/CVF International Conference on Computer Vision, pages 2763–2772, 2021. 1
[5]. Geoffrey Hinton. How to represent part-whole hierarchies in a neural network. arXiv preprint arXiv:2102.12627, 2021. 1
[6]. Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephen Lin, and Baining Guo. Swin transformer: Hierarchical vision transformer using shifted windows. International Conference on Computer Vision (ICCV), 2021. 2, 4
[7]. Andrew Y Ng, Michael I Jordan, and Yair Weiss. On spectral clustering: Analysis and an algorithm. In Advances in neural information processing systems, pages 849–856, 2002. 1, 5
[8]. Shuo Yang, Lu Liu, and Min Xu. Free lunch for few-shot learning: Distribution calibration. In International Conference on Learning Representations (ICLR), 2021. 6
[9]. Chi Zhang, Yujun Cai, Guosheng Lin, and Chunhua Shen. Deepemd: Few-shot image classification with differentiable earth mover’s distance and structured classifiers. In IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), June 2020. 6, 7, 8

閱讀全文

計算機視覺(45543) 計算機視覺(45543)
cnn(21235) cnn(21235)

語音應用中Transformer和循環(huán)神經(jīng)網(wǎng)絡的比較

在Transformer中，注意力圖的某些頭部并不總是像Tacotron 2中那樣是對角線的。因此，我們需要選擇在哪些位置應用引導性注意力損失[24]。-使用Transformer進行解碼的速度也比使用RNN慢（每幀6.5毫秒 vs 單線程CPU上每幀78.5毫秒）。

2023-07-24 11:30:31

356

網(wǎng)絡安全體系基礎架構建設

網(wǎng)絡安全體系基礎架構建設知識 ? ?

2023-09-11 09:36:01

1210

關于深度學習模型Transformer模型的具體實現(xiàn)方案

Transformer 本質(zhì)上是一個 Encoder-Decoder 架構。因此中間部分的 Transformer 可以分為兩個部分：編碼組件和解碼組件。

2023-11-17 10:34:52

213

分層隔離知識概述

分層隔離

2019-06-21 08:51:58

分層隔離基礎知識淺談

isoPower?器件集成電源的問世，通過分層隔離器建立高壓隔離柵現(xiàn)在已經(jīng)成為一種可行解決方案。由于新型電池和發(fā)電產(chǎn)業(yè)的快速擴張，我們需要具有很高工作電壓的接口，還要求提供加強絕緣。例如，太陽能逆變器

2018-11-01 10:48:36

網(wǎng)絡協(xié)議osi的分層

網(wǎng)絡協(xié)議osi的分層，路由器在哪一層應用層，表示層，會話層，傳輸層，網(wǎng)絡層，數(shù)據(jù)鏈路層，物理層路由器在網(wǎng)絡層 jnijava本地接口在android系統(tǒng)...

2021-08-06 08:20:57

網(wǎng)絡協(xié)議基礎知識推薦

目錄一、基礎協(xié)議1、網(wǎng)絡分層模型2、協(xié)議劃分3、重點解析1）TCP/IP和UDP協(xié)議2）HTTP和HTTPS協(xié)議3）WS和WSS協(xié)議4）SSL、TLS和SSH協(xié)議5）SOAP協(xié)議二、應用知識一

2021-07-02 06:56:27

AD8367級聯(lián)使用時需要加匹配網(wǎng)絡嗎？

將兩個AD8367級聯(lián)使用時，第一級的輸出與第二級的輸入之間是否還需要加匹配網(wǎng)絡呢？根據(jù)手冊上的描述，輸出RL時200歐姆，而AD8367的輸入也是200歐，那么是否可以不用匹配而直接將第一級的輸出

2019-03-08 14:15:39

ARM架構基礎知識小結

從單片機轉(zhuǎn)到ARM ―― ARM架構基礎知識小結

2020-12-29 06:16:15

AUTOSAR分層架構

2016-09-26 11:12:22

Laravel路由的分層

Laravel 路由分層架構

2020-04-10 14:09:56

labview BP神經(jīng)網(wǎng)絡的實現(xiàn)

是classes（層級嗎？），希望有前輩能夠詳細的幫我講解下這個范例?。。≈x謝?。。。。ū救艘褜P神經(jīng)網(wǎng)絡的理論知識有了了解）

2017-02-22 16:08:08

你了解在單GPU上就可以運行的Transformer模型嗎

最近，谷歌推出了Reformer架構，Transformer模型旨在有效地處理處理很長的時間序列的數(shù)據(jù)(例如，在語言處理多達100萬個單詞)。Reformer的執(zhí)行只需要更少的內(nèi)存消耗，并且即使在

2022-11-02 15:19:41

關于網(wǎng)絡分層結構的介紹

第1章概述一.單選題（共8題）1關于網(wǎng)絡分層結構，下面的敘述正確的是_________。A、某一層可以使用其上層提供的服務而不需知道服務是如何實現(xiàn)的（應該是下層） B、當某一層發(fā)生變化時，只要接口

2021-07-28 09:46:18

關于AUTOSAR架構的知識點看完你就懂了

2021-10-18 07:41:04

卷積神經(jīng)網(wǎng)絡的層級結構和常用框架

　　卷積神經(jīng)網(wǎng)絡的層級結構　　卷積神經(jīng)網(wǎng)絡的常用框架

2020-12-29 06:16:44

在哪里設置鴻蒙WebView的層級？

不管WebView在布局中哪個層級，都會最外層顯示出來，這個有啥處理辦法嗎？

2022-03-25 09:51:41

基于MEC的網(wǎng)絡架構介紹

MEC與運營商的網(wǎng)絡重構基于MEC的網(wǎng)絡架構介紹MEC目前進展及面臨的挑戰(zhàn)

2020-12-25 06:52:30

基于SDN的OTN網(wǎng)絡架構怎么樣？

2021-05-24 06:43:01

基于mcu的一種分層軟件架構的相關資料分享

基于mcu的一種分層軟件架構（一）1、寫在前面先來個圖：經(jīng)過了一段時間的琢磨與思考。借鑒操作系統(tǒng)的分層原理，也搞出來了一種mcu的層狀軟件結構。好了，不說虛的啦。所有的一些方法和思想，都是對經(jīng)歷痛點

2021-11-03 06:46:07

如何更改ABBYY PDF Transformer+界面語言

在安裝ABBYY PDF Transformer+時會讓您選擇界面語言。此語言將用于所有消息、對話框、按鈕和菜單項。在特殊情況下，您可能需要在安裝完成后更改界面語言以適應需求，方法其實很簡單，本文

2017-10-11 16:13:38

如何用Python創(chuàng)建自己的Dino Run?

　今天，將向大家展示如何構建離線狀態(tài)下幾乎每個人都可以玩的最受歡迎的游戲之一。如果您猜測哪個游戲，就是在談論瀏覽器的Dino游戲。但是，我們的Dino游戲是彩色版本的瀏覽器版本的修改形式?，F(xiàn)在

2020-07-21 18:11:34

嵌入式分層架構的相關資料分享

最近重新進入嵌入式領域，有必要對嵌入式分層架構有一個清晰的理解。經(jīng)過多方查閱以及個人的理解，本人對嵌入式分層架構概括總結如下：比較細的層次由下到上可分為：（硬件層）硬件底層->硬件驅(qū)動層

2021-10-28 08:42:11

嵌入式軟件基礎的四層架構分別是哪些

嵌入式軟件分層架構基本原則有哪些？嵌入式軟件基礎的四層架構分別是哪些？

2021-12-24 07:57:52

巧妙解決路由器網(wǎng)絡分層問題

介紹了對于路由器網(wǎng)絡分層出現(xiàn)問題，如何進行診斷和故障的排除，相信大家看過此文會對你有所幫助。網(wǎng)絡診斷是管好、用好網(wǎng)絡，使網(wǎng)絡發(fā)揮最大作用的重要技術工作。本文簡述分層診斷技術，結合討論路由器各種接口

2018-12-10 10:17:11

有沒有辦法增加ZIGBEE網(wǎng)絡拓撲層級數(shù)？

小弟在使用ZIGBEE時遇到這個問題，ZIGBEE網(wǎng)絡拓撲層數(shù)最多為15層，請教下各位老師，有沒有辦法使層數(shù)增加呢，因為我們的使用環(huán)境可能會有幾十盡百個拓撲層級存在。使用CC2530.非常感謝！

2020-04-30 06:55:26

淺談ARM處理器架構

來說，ARM的授權分為三個層級：使用層級授權、內(nèi)核層級授權架構、指令集層級授權這三個層級的權限是依次上升的。對芯片設計公司的要求也是從低到高，而發(fā)揮的空間也是從低到高：指令集層級授權（也成軟核）發(fā)揮

2020-08-18 12:04:06

系統(tǒng)層級靜電放電與芯片層級靜電放電有什么差異

軍方所制定的人體靜電放電模型最具代表性，又稱之為芯片層級靜電放電測試。而針對終端消費者所使用的電子產(chǎn)品，則以IEC 61000-4-2所制定的人體靜電放電模型為測試主流，這就是一般認知的系統(tǒng)層級靜電放電

2019-07-25 06:45:53

該如何去計算整個級聯(lián)網(wǎng)絡的噪聲系數(shù)？

一個級聯(lián)網(wǎng)絡，由三級構成，第一級NF為4dB，增益為14dB，第二級是一個插入損耗3dB的濾波器，第三級的NF為8dB，增益為16.9dB。問整個級聯(lián)網(wǎng)絡的噪聲系數(shù)是多少？我看了級聯(lián)網(wǎng)絡的計算公式

2021-06-24 07:17:00

請問網(wǎng)絡改變顏色之后該怎么區(qū)分層？

網(wǎng)絡改變顏色之后怎么區(qū)分層？

2019-06-18 23:53:55

請問labview tree如何固定層級關系

如圖所示：自己做的Labview傳感器配置界面，當使用添加/刪除，功能后，層級關系會自動打開所有層級，非常不方便，請教在進行添加/刪除或者別的操作的時候，操作結束以后可以調(diào)用上一次的層級關系，不會默認全部打開。

2019-03-26 20:22:08

談談MC9S12G128模塊的軟件分層架構

內(nèi)容修改歷史.. 2內(nèi)容.. 31 overview. 41.1 目的.. 42 軟件分層架構.. 52.1 driver層.. 52.2 中間件層.. 63 port資源.. 73.1 數(shù)據(jù)方向

2021-12-10 06:09:43

級聯(lián)LDPC碼和CCK的編碼調(diào)制性能分析

在加性白高斯信道下，比較了補碼鍵控最優(yōu)譯碼和大數(shù)邏輯軟判決譯碼的性能，分析了補碼鍵控在衰落信道的性能，并提出了補碼鍵控外層級聯(lián)低密度極性校驗碼的結構，提供了

2009-02-28 16:41:38

分層審核管理-LPA

為了幫助企業(yè)驗證生產(chǎn)過程的標準性，保障制造過程的穩(wěn)定性，形成逐級審核的流程制度，提高管理水平。北匯信息為此打造了“分層審核系統(tǒng)--PAVELINK.lpa”。由管理層組織各級人員按照預先計劃

2022-07-25 11:52:40

級聯(lián)碼,什么是級聯(lián)碼

級聯(lián)碼,什么是級聯(lián)碼 級聯(lián)碼：要想進一步提高編碼的性能，必須加長編碼。對于線性分組碼就是加長n，對卷積碼就是加長K。但很快

2010-04-03 12:11:52

2928

路由器網(wǎng)絡分層問題分析

介紹了對于路由器網(wǎng)絡分層出現(xiàn)問題，如何進行診斷和故障的排除，相信大家看過此文會對你有所幫助?！　?b class="flag-6" style="color: red">網(wǎng)絡診斷是管好、用好網(wǎng)絡，使網(wǎng)絡發(fā)揮最大作用的重要技術工作。

2010-09-01 17:54:36

1944

軟件架構設計之常用架構模式

分層架構：分層架構是使用最多的架構模式，通過分層使各個層的職責更加明確，通過定義的接口使各層之間通訊,上層使用下層提供的服務。分層分為：嚴格意義上的分層，一般意義的

2011-06-22 18:35:41

4335

級聯(lián)Blumlein型脈沖網(wǎng)絡充電電源設計

各級Blumlein型脈沖形成網(wǎng)絡充電電壓的不一致是影響級聯(lián)脈沖形成網(wǎng)絡電壓傳輸效率的因素之一，為了使級聯(lián)網(wǎng)絡的充電電壓一致，設計了一種多路充電電源。每路電源由脈沖變壓器，

2013-03-12 16:24:16

級聯(lián)Blumlein型脈沖網(wǎng)絡電感設計

為了利用級聯(lián)Blumlein型脈沖形成網(wǎng)絡在高阻抗負載產(chǎn)生理想的高壓平頂脈沖輸出，開展了構成該脈沖功率源關鍵單元的始端電感和終端電感設計。從充電電壓一致性，輸出脈沖不發(fā)生嚴

2013-04-27 16:14:36

內(nèi)容中心網(wǎng)絡的分層緩存策略研究

內(nèi)容中心網(wǎng)絡的分層緩存策略研究_夏磊

2017-01-03 18:00:37

軟件定義內(nèi)容網(wǎng)絡中基于分層的緩存管理

軟件定義內(nèi)容網(wǎng)絡中基于分層的緩存管理_劉靜

2017-01-07 20:49:27

邁向分層網(wǎng)絡架構 5G通訊系統(tǒng)引發(fā)量測技術變革

作者：Hongwei Kong 是德科技中國北京實驗室 5G無線通信系統(tǒng)將運用極密集網(wǎng)絡布建方式達成更高帶寬與傳輸速率，因而須以分層式網(wǎng)絡架構進行管理，以提高網(wǎng)絡效率與服務質(zhì)量；而此一架構的轉(zhuǎn)變

2017-02-09 05:02:00

352

軟件架構設計之常用架構模式介紹

1.分層架構：分層架構是使用最多的架構模式，通過分層使各個層的職責更加明確，通過定義的接口使各層之間通訊,上層使用下層提供的服務。分層分為：嚴格意義上的分層，一般意義的分層。嚴格意義的分層是n+1

2017-12-01 11:59:48

297

無線傳感器網(wǎng)絡分層路由協(xié)議HRPNC

針對大規(guī)模無線傳感器網(wǎng)絡（WSN）中由于簇首節(jié)點分布不合理而導致節(jié)點消耗能量過快的問題，設計了一種基于非均勻分簇的無線傳感器網(wǎng)絡分層路由協(xié)議（ HRPNC）。HRPNC結合低功耗自適應集簇分層型協(xié)議

2017-12-25 09:50:24

加權無標度網(wǎng)絡的級聯(lián)失效模型

在加權的無標度網(wǎng)絡中，為了抵抗網(wǎng)絡的級聯(lián)失效，增強網(wǎng)絡的魯棒性，提出了一種參數(shù)可調(diào)的級聯(lián)失效模型．該模型從全局和局域的角度，將節(jié)點介數(shù)、節(jié)點度、節(jié)點權重和鄰居節(jié)點權重相結合構建節(jié)點的初始負載，并建立

2017-12-26 10:47:47

直接序列擴頻通信的分層級聯(lián)隨機共振接收算法

為提高現(xiàn)有直接序列擴頻通信的接收信號的解調(diào)增益，提出分層級聯(lián)隨機共振接收算法。通過在接收信號的載波下變頻和基帶信號解擴過程中分別設計級聯(lián)雙穩(wěn)態(tài)隨機共振系統(tǒng)，一方面實現(xiàn)了正弦載波信號的寬帶化解調(diào)接收

2018-01-12 13:56:58

長安汽車新能源板塊“分層級”發(fā)展與與蔚來合作不是代工模式

新能源產(chǎn)業(yè)還在不斷地崛起，中國宣布將在2025年實現(xiàn)全面停售傳統(tǒng)意義燃油車的日期也在漸漸的逼近。但是對于長安汽車來說，已經(jīng)是新能源的模式了。近日關于新能源板塊的“分層級”發(fā)展，長安朱華榮表示與蔚來汽車之間的合作絕對不是代工模式。

2018-01-26 16:28:48

1261

基于分層PE技術的MPLS-VPN架構優(yōu)化

針對傳統(tǒng)MPLS-VPN組網(wǎng)架構存在的擴展性不足、安全性不高與傳輸質(zhì)量差等問題，提出一種使用層次化運營商邊緣設備技術優(yōu)化網(wǎng)絡架構的方法。采用設備層級化的方式對網(wǎng)絡拓撲結構進行優(yōu)化改造，使設備的路由

2018-02-02 16:26:11

什么是分層架構的依據(jù)與原則？本文告訴你答案！

分層架構是運用最為廣泛的架構模式，幾乎每個軟件系統(tǒng)都需要通過層（Layer）來隔離不同的關注點（Concern Point），以此應對不同需求的變化，使得這種變化可以獨立進行；此外，分層架構模式還是隔離業(yè)務復雜度與技術復雜度的利器，《領域驅(qū)動設計模式、原理與實踐》寫道：

2018-07-27 14:16:28

7097

谷歌將AutoML應用于Transformer架構,翻譯結果飆升!

為了探索AutoML在序列域中的應用是否能夠取得的成功，谷歌的研究團隊在進行基于進化的神經(jīng)架構搜索（NAS）之后，使用了翻譯作為一般的序列任務的代理，并找到了Evolved Transformer這一新的Transformer架構。

2019-06-16 11:29:22

2842

電信網(wǎng)分層匯聚的網(wǎng)絡架構面臨著很大的挑戰(zhàn)

進入互聯(lián)網(wǎng)時代后，用戶對網(wǎng)絡消費的模式發(fā)生了巨大變化，電信網(wǎng)分層匯聚的網(wǎng)絡架構面臨著很大的挑戰(zhàn)。對于互聯(lián)網(wǎng)用戶，除了原有的人與人之間的通信外，更大量的是人與物（機器及數(shù)據(jù)中心）之間的通信，而且通信的時間長度和帶寬需求也變得更大和更不確定。

2019-11-07 10:52:10

3290

3D目標檢測是否可以用層級圖網(wǎng)絡來完成

電子發(fā)燒友網(wǎng)站提供《3D目標檢測是否可以用層級圖網(wǎng)絡來完成.pdf》資料免費下載

2020-11-26 16:55:29

深度學習：知識蒸餾的全過程

。? 0. 寫在前面有人說過：“神經(jīng)網(wǎng)絡用剩的logits不要扔，沾上雞蛋液，裹上面包糠...” 這兩天對知識蒸餾(Knowledge Distillation)萌生了一點興趣，正好寫一篇文章分享一下。這篇文章姑且算是一篇小科普。 1. 從模型壓縮開始各種模型算法，最終目的

2021-01-07 14:36:07

5543

知乎搜索中文本相關性和知識蒸餾的工作實踐

導讀：大家好，我是申站，知乎搜索團隊的算法工程師。今天給大家分享下知乎搜索中文本相關性和知識蒸餾的工作實踐，主要內(nèi)容包括：知乎搜索文本相關性的演進 BERT在知乎搜索的應用和問題知識蒸餾及常見

2021-01-18 17:20:59

2480

一種多層級特征融合就的深度卷積網(wǎng)絡

采用卷積神經(jīng)網(wǎng)絡對單目圖像的深度進行估計時，存在深度信息不精確、邊緣模糊以及細節(jié)缺失等問題。為此，提出一種多層級特征融合結構的深度卷積網(wǎng)絡。該網(wǎng)絡采用端到端的編-解碼器結構，編碼器

2021-03-16 09:21:20

圖神經(jīng)網(wǎng)絡的知識蒸餾框架介紹

隨著深度學習的成功，基于圖神經(jīng)網(wǎng)絡（GNN）的方法［8，12，30］已經(jīng)證明了它們在分類節(jié)點標簽方面的有效性。大多數(shù)GNN模型采用消息傳遞策略［7］：每個節(jié)點從其鄰域聚合特征，然后將具有非線性激活

2021-04-04 16:48:00

4787

一種上下文感知與層級注意力網(wǎng)絡的文檔分類方法

集中于當前所編碼的句子，并沒有有效地將文檔結構知識整合到體系結構中。針對此問題，提出種上下文感知與層級注意力網(wǎng)絡的文檔分類方法（ CAHAN）。該方法采用分層結構來表示文檔的層次結構，使用注意力機制考慮文檔中重要的句

2021-04-02 14:02:29

詳解一種簡單而有效的Transformer提升技術

近些年，Transformer［1］逐漸成為了自然語言處理中的主流結構。為了進一步提升Transformer的性能，一些工作通過引入額外的結構或知識來提升Transformer在特定任務上的表現(xiàn)。

2021-04-09 09:50:57

5973

基于知識蒸餾的惡意代碼家族檢測方法研究綜述

近年來，惡意代碼變種層出不窮，惡意軟件更具隱蔽性和持久性，亟需快速有效的檢測方法來識別惡意樣本。針對現(xiàn)文中提出了一種基于知識蒸餾的惡意代碼家族檢測方法，該模型通過逆向反編譯惡意樣本，利用惡意代碼

2021-04-20 14:49:30

如何使用Transformer來做物體檢測？

導讀本文為一個Facebook的目標檢測Transformer （DETR）的完整指南，詳細介紹了DETR架構的內(nèi)部工作方式以及代碼。介紹 DEtection TRansformer （DETR

2021-04-25 10:45:49

2296

異構網(wǎng)絡下解耦ULDL級聯(lián)DLA聯(lián)合方案

針對異構網(wǎng)中上行鏈路（UL）和下行鏈路（DL）負載不平衡的問題，提岀一種解耦ULDL級聯(lián)（DUA）聯(lián)合方案。通過雙連接簡化級聯(lián)條件推導主、從UL接入距離的概率密度函數(shù)，利用隨機幾何工具推導 DUDA

2021-05-11 11:45:22

基于深度級聯(lián)孿生網(wǎng)絡的通信信號調(diào)制識別算法

為解決傳統(tǒng)基于深度學習的調(diào)制識別算法在小樣本條件下識別準確率較低的問題，提出一種基于深度級聯(lián)孿生網(wǎng)絡的通信信號小樣本調(diào)制識別算法。根據(jù)通信信號時序圖的時空特性，設計由卷積神經(jīng)網(wǎng)絡和長短時記憶網(wǎng)絡級聯(lián)

2021-05-14 10:25:00

基于分層注意力的社交網(wǎng)絡信息級聯(lián)預測

信息級聯(lián)預測（ Information Cascade prediction）是社交網(wǎng)絡分析領域的一個研究熱點，其通過信息級聯(lián)的擴散序列與拓撲圖來學習在線社交媒體中信息的傳播模式。當前的信息級聯(lián)預測

2021-05-29 14:52:26

使用跨界模型Transformer來做物體檢測！

用了Transformer 架構開發(fā)的一個目標檢測模型。在這篇文章中，我將通過分析DETR架構的內(nèi)部工作方式來幫助提供一些關于它的直覺。下面，我將解釋一些結構，但是如果你只是想了解如何使用模型，可以直接跳到代碼部分

2021-06-10 16:04:39

1912

變壓器(Transformer)基礎知識詳解

變壓器(Transformer)基礎知識點免費下載。

2021-06-23 11:47:31

基于層級循環(huán)神經(jīng)網(wǎng)絡的X線線圖像腰椎識別

基于層級循環(huán)神經(jīng)網(wǎng)絡的X線線圖像腰椎識別

2021-06-27 11:24:46

軍用Ad Hoc網(wǎng)絡分層體系架構及安全協(xié)議綜述

2021-06-27 14:27:28

基于mcu的一種分層軟件架構

基于mcu的一種分層軟件架構（一）1、寫在前面先來個圖：經(jīng)過了一段時間的琢磨與思考。借鑒操作系統(tǒng)的分層原理，也搞出來了一種mcu的層狀軟件結構。好了，不說虛的啦。所有的一些方法和思想，都是對經(jīng)歷

2021-10-28 09:51:01

MC9S12G128模塊化分層化軟件架構之七_外部中斷

2021-12-05 09:06:09

嵌入式硬件通信接口協(xié)議-SPI（二）分層架構設計模擬接口

2021-12-09 12:36:07

AUTOSAR分層架構介紹及SmartSAR studio使用總結

AUTOSAR分層架構

2022-03-28 16:44:22

若干蒸餾方法之間的細節(jié)以及差異

以往的知識蒸餾雖然可以有效的壓縮模型尺寸，但很難將teacher模型的能力蒸餾到一個更小詞表的student模型中，而DualTrain+SharedProj解決了這個難題。

2022-05-12 11:39:50

1092

關于快速知識蒸餾的視覺框架

知識蒸餾框架包含了一個預訓練好的 teacher 模型（蒸餾過程權重固定），和一個待學習的 student 模型, teacher 用來產(chǎn)生 soft 的 label 用于監(jiān)督 student 的學習。

2022-08-31 10:13:11

612

常見的軟件架構分層

系統(tǒng)架構思想是軟件開發(fā)工程師的工作必備知識。大到大型互聯(lián)網(wǎng)應用系統(tǒng)的設計，小到一個軟件功能函數(shù)的設計，都需要擁有架構設計思想。

2022-10-13 11:56:46

8294

使用Arduino的自動Chrome Dino游戲

電子發(fā)燒友網(wǎng)站提供《使用Arduino的自動Chrome Dino游戲.zip》資料免費下載

2022-10-28 16:39:44

基于Arduino的兩足機器人Baby Dino

電子發(fā)燒友網(wǎng)站提供《基于Arduino的兩足機器人Baby Dino.zip》資料免費下載

2022-11-04 10:20:27

用于NAT的選擇性知識蒸餾框架

盡管NAT在擁有許多潛在的優(yōu)勢，目前的工作中這類模型仍然在很大程度上依賴于句子級別的知識蒸餾（sequence-level knowledge distillation, KD）[2]。由于需要并行預測所有token，NAT對單詞間依賴關系的建模能力較弱。

2022-12-06 14:44:10

451

無殘差連接或歸一化層，也能成功訓練深度transformer

殘差架構是最流行和成功的，最初是在卷積神經(jīng)網(wǎng)絡（CNN）的背景下開發(fā)的，后來自注意力網(wǎng)絡中產(chǎn)生了無處不在的 transformer 架構。殘差架構之所以取得成功，一種原因是與普通 DNN 相比具有更好的信號傳播能力，其中信號傳播指的是幾何信息通過 DNN 層的傳輸，并由內(nèi)核函數(shù)表示。

2022-12-12 11:23:09

382

基于動態(tài)層級通信的多無人機協(xié)同策略方案

本文針對通信受限環(huán)境中的多無人機協(xié)同決策問題，提出一種基于動態(tài)層級網(wǎng)絡通信架構的通信強化學習協(xié)同策略。

2022-12-13 11:47:09

810

Baby Dino是基于Arduino的兩足機器人

Baby Dino 是一個基于 Arduino 的兩足機器人。它基本上使用五個伺服電機，每條腿兩個，頭部一個。它還使用超聲波傳感器來檢測障礙物并避開它們?，F(xiàn)在，讓我們看看如何制作吧！第 1 步：簡介

2022-12-19 16:30:04

分層單體架構系統(tǒng)的風格及其本質(zhì)

分層單體架構風格是分層思想在單體架構中的應用，其關注于技術視角的職責分層。

2023-01-16 15:31:54

766

如何度量知識蒸餾中不同數(shù)據(jù)增強方法的好壞？

知識蒸餾（knowledge distillation，KD）是一種通用神經(jīng)網(wǎng)絡訓練方法，它使用大的teacher模型來 “教” student模型，在各種AI任務上有著廣泛應用。

2023-02-25 15:41:33

484

DepGraph：任意架構的結構化剪枝，CNN、Transformer、GNN等都適用！

結構化剪枝是一種重要的模型壓縮算法，它通過移除神經(jīng)網(wǎng)絡中冗余的結構來減少參數(shù)量，從而降低模型推理的時間、空間代價。在過去幾年中，結構化剪枝技術已經(jīng)被廣泛應用于各種神經(jīng)網(wǎng)絡的加速，覆蓋了ResNet、VGG、Transformer等流行架構。

2023-03-29 11:23:52

2932

從分層架構到微服務架構介紹（一）

們看到一個架構模式的名字時，也要馬上想到對應的架構圖及其基本特點。比如，當談到**分層架構**時，我們就應該想起它的架構圖是怎樣的、有哪些出色的架構特征（architecture characteristics）、系統(tǒng)是如何部署的、數(shù)據(jù)存儲的策略是哪種、等等。

2023-05-10 16:55:29

756

使用arduino和python改造的Chrome Dino游戲

電子發(fā)燒友網(wǎng)站提供《使用arduino和python改造的Chrome Dino游戲.zip》資料免費下載

2023-07-05 14:43:45

基于魯棒神經(jīng)架構的設計

導讀繼卷積神經(jīng)網(wǎng)絡之后，Transformer又推進了圖像識別的發(fā)展，成為視覺領域的又一主導。最近有人提出Transformer的這種優(yōu)越性應歸功于Self-Attention的架構本身，本文帶著

2023-07-17 14:35:53

269

Linux網(wǎng)絡棧總體架構

網(wǎng)絡?？傮w架構總體結構 網(wǎng)絡棧指的是為了進行網(wǎng)絡數(shù)據(jù)包的收發(fā)，由內(nèi)核實現(xiàn)的一套函數(shù)集合。網(wǎng)絡棧安裝預先設置的一套規(guī)則對用戶數(shù)據(jù)進行封裝從而達到網(wǎng)絡上主機之間數(shù)據(jù)交換的目的。最初按照這種分層

2023-07-24 10:59:21

311

RetNet架構和Transformer架構對比分析

微軟研究院最近提出了一個新的 LLM 自回歸基礎架構 Retentive Networks （RetNet）[1,4]，該架構相對于 Transformer 架構的優(yōu)勢是同時具備:訓練可并行、推理成本低和良好的性能，不可能三角。

2023-07-26 10:44:47

933

卷積神經(jīng)網(wǎng)絡層級結構卷積神經(jīng)網(wǎng)絡的卷積層講解

卷積神經(jīng)網(wǎng)絡層級結構卷積神經(jīng)網(wǎng)絡的卷積層講解卷積神經(jīng)網(wǎng)絡（Convolutional Neural Network，CNN）是一種基于深度學習的神經(jīng)網(wǎng)絡模型，在許多視覺相關的任務中表現(xiàn)出色，如圖

2023-08-21 16:49:42

3757