精品国语任你躁在线播放,91网址在线播放,天堂官网在线资源网

Continual Test-Time 的領域適應

前言

相關工作

Source Data Adaptation

Target Data Adaptation

CoTTA 概述

CoTTA 詳細介紹

Weight-Averaged Pseudo-Labels

Augmentation-Averaged Pseudo-Labels

Stochastic Restoration

實驗

結論

參考

前言

Continual Test-Time 的領域適應（CoTTA）在 CVPR 2022 上被提出，目的是在不使用任何源數(shù)據(jù)（source domain）的情況下，將源預訓練模型適應于目標域（target domain）?，F(xiàn)有的研究主要關注于處理靜態(tài) target domain 的情況。然而，在現(xiàn)實世界中，機器感知系統(tǒng)必須在不穩(wěn)定且不斷變化的環(huán)境中運行，target domain 的分布會隨時間不斷變化。

現(xiàn)有的方法主要基于自訓練和熵正則化，但它們還是可能受到這些非穩(wěn)定環(huán)境的影響。由于 target domain 內的分布隨時間發(fā)生偏移，偽標簽變得不可靠。因此，帶有噪聲的偽標注進一步導致錯誤積累和災難性遺忘。為了應對這些問題，這篇文章提出了一種測試時領域適應方法（CoTTA）。

在正式介紹 CoTTA 之前，我們先來熟悉一些相關工作。

相關工作

Source Data Adaptation

Domain Adaptation (DA) ：此時，我們有源數(shù)據(jù) + 源標簽 + 目標數(shù)據(jù)，希望模型做到在沒看過的?標數(shù)據(jù)上性能好，目標數(shù)據(jù)的標簽限制到很少或者為零。

Domain Generalization (DG) ：此時，我們有源數(shù)據(jù) + 源標簽，希望模型做到在?標數(shù)據(jù)上性能好。

Target Data Adaptation

Source-Free Domain Adaptation (SFDA)： 在上面的 settings 中，訓練過程是可以訪問到源域數(shù)據(jù)的。但是在實際情況中，由于隱私原因（醫(yī)療數(shù)據(jù)不能公開）或者數(shù)據(jù)量問題，我們并不能獲取到源域數(shù)據(jù)，而只能獲取到源域所訓練好的模型。這個 setting 的目的就是只利用源模型來完成 Domain Adaptation。

Test-Time Training (TTT)： 從信息的角度，從前我們訓練神經網(wǎng)絡都只利用了訓練集的信息（監(jiān)督學習），但其實測試集也從數(shù)據(jù)分布的角度提供了信息。這個 setting 主要就是提出了一種同時利用了訓練集信息，和測試集所提供的數(shù)據(jù)分布的信息去訓練神經網(wǎng)絡的方法。允許?次性獲得整個測試數(shù)據(jù)集，并且多次迭代。測試時根據(jù)測試樣本泛化，可以獲取源數(shù)據(jù)。

Test-Time Adaptation (TTA)： 傳統(tǒng)的模型訓練后固定，在測試時無法改變。TTA 可以讓模型在測試時可以快速地微調和調整，從而能夠面對現(xiàn)實世界中，數(shù)據(jù)的分布不斷演化的過程。TTA 是 Domain Adaptation 的一個分支。它們同樣有一個源域和一個目標域，首先在源域上進行預訓練，然后半監(jiān)督或無監(jiān)督地適應到目標域上。兩者的主要區(qū)別在于，Test-Time Adaptation 的訓練在測試的同時完成?？梢院唵卫斫鉃椋琓est-Time Adaptation 是只經過一個 epoch 的 DA。另一個區(qū)別在于，DA 往往報告模型訓練完成后的模型性能，而 TTA 的測試和訓練是同時進行的，故報告的性能介于訓練前和訓練結束之間。我們可以獲得源模型 + 整個測試數(shù)據(jù)。

CoTTA 概述

先考慮一個問題，為什么要從 TTA 到 CoTTA？現(xiàn)有的方法通常遭受錯誤累積和遺忘（Error Accumulation and Forgetting）的問題，問題只出現(xiàn)在 Backward-based model 中。Error Accumulation：切換 domain 時性能會直接崩掉，因為 overfit 上?個 domain 的噪聲。Forgetting：long-term update 導致遺忘 pre-trained model 的信息.

CoTTA 能使預先訓練好的源模型適應不斷變化的測試數(shù)據(jù)。它克服了現(xiàn)有方法的兩個主要局限性。該方法的第一個組成部分旨在減少誤差積累。CoTTA 采用了兩種不同的方式來提高自訓練框架下的偽標簽質量。首先，使用了平均權重教師模型來提供更準確的預測，因為平均教師預測通常比標準模型具有更高的質量。其次，對于存在較大域差異的測試數(shù)據(jù)，使用增強平均預測來進一步提高偽標簽的質量。該方法的第二部分旨在幫助保存源知識并避免遺忘。建議將網(wǎng)絡中的一小部分神經元隨機恢復到預先訓練好的源模型中。通過減少誤差積累并保留知識，CoTTA能夠在不斷變化的環(huán)境中進行長期適應，并實現(xiàn)對訓練網(wǎng)絡的所有參數(shù)的調整。

需要指出的是，權重平均和增強平均策略以及隨機恢復可以輕松地整合到任何現(xiàn)有的預訓練模型中，而無需重新訓練源數(shù)據(jù)。這篇證明了我們提出的方法在四個分類任務和分割任務中的有效性，并顯著提高了現(xiàn)有方法的性能。CoTTA 的貢獻包括：

提出了一種持續(xù)測試時間自適應方法，能夠使現(xiàn)有的預訓練源模型有效適應不斷變化的目標數(shù)據(jù)。

通過采用更準確的權重平均和增強平均偽標簽，減少了誤差積累。

通過明確保留源模型中的知識，緩解了長期遺忘效應。

CoTTA 詳細介紹

給定一個現(xiàn)有的預訓練模型，參數(shù)θ訓練在源數(shù)據(jù) 上，我們的目標是在推理期間以不訪問任何源數(shù)據(jù)的在線方式，使用持續(xù)更改的目標域，提高這個現(xiàn)有模型的性能。未標記的目標域數(shù)據(jù) 依次提供，模型只能訪問當前時間步長的數(shù)據(jù)。在時間步 t，提供目標數(shù)據(jù) 作為輸入，模型需要進行預測，并相應地適應未來的輸入。的數(shù)據(jù)分布也在不斷變化。該模型是基于在線預測進行評估的。這種 setting 很大程度上是由于在不斷變化的環(huán)境中對機器感知應用程序的需要。例如，由于位置、天氣和時間的原因，自動駕駛汽車的周圍環(huán)境正在不斷變化。感知決策需要在網(wǎng)上（online）做出，模型需要進行調整。如下圖所示，CoTTA 是一種在線連續(xù)測試時間自適應方法。該方法采用一個現(xiàn)成的源預訓練模型，并以在線的方式適應不斷變化的目標數(shù)據(jù)。由于誤差積累是自訓練框架中的關鍵瓶頸之一，CoTTA 建議使用權重平均和增強平均偽標簽減少錯誤積累。此外，為了幫助減少持續(xù)適應中的遺忘，CoTTA 建議明確地保留從源模型中獲得的信息。下面的部分將分別介紹 CoTTA 貢獻中涉及到的三個內容。

Weight-Averaged Pseudo-Labels

權重平均一致性的好處是雙重的。一方面，通過使用通常更準確的權重平均預測作為偽標簽目標，模型在連續(xù)適應過程中遭受較少的誤差積累。另一方面，平均教師預測編碼了過去迭代中模型的信息，因此在長期持續(xù)適應中不太可能發(fā)生災難性遺忘，提高了對新的看不見領域的泛化能力。這一步沒什么可以進一步介紹的，受到了在半監(jiān)督學習中提出的平均教師方法的啟發(fā)。

Augmentation-Averaged Pseudo-Labels

數(shù)據(jù)增強是在訓練期間對原始數(shù)據(jù)進行一系列變換和擴充的技術，旨在增加訓練數(shù)據(jù)的多樣性，從而提高模型的性能。研究人員通常手動設計或搜索適合不同數(shù)據(jù)集的增強策略。另外，經過證明，在測試期間進行數(shù)據(jù)增強也可以提高模型的魯棒性，即對不同類型的輸入能夠更好地進行預測。然而，測試時間的增強策略通常是為特定數(shù)據(jù)集確定并固定的，沒有考慮到推理期間數(shù)據(jù)分布的變化。在實際應用中，測試數(shù)據(jù)的分布可能會因為環(huán)境的不斷變化而發(fā)生顯著改變，這可能導致原先確定的增強策略失效。為了解決這個問題，這篇文章提出了一種考慮測試時間領域遷移的方法，并通過預測的置信度來近似領域之間的差異。只有當領域之間的差異較大時，才會應用增強技術，以減少由于錯誤累積而引起的問題。這種方法能夠更好地適應不斷變化的環(huán)境，提高模型在測試期間的性能和魯棒性。

其中是教師模型的增強平均預測，是教師模型的直接預測，是源預訓練模型對當前輸入的預測置信度，是一個置信閾值。通過使用上面中預先訓練的模型計算當前輸入的預測一致性，試圖近似源和當前域之間的域差。假設，較低的置信度表示越大的域間隙，相對較高的置信度表示域間隙越小。因此，當置信度高且大于閾值時，我們直接使用作為偽標簽，而不使用任何增強。當置信度較低時，額外應用 N 個隨機增強來進一步提高偽標簽的質量。當觀察到隨機的增加時，過濾是關鍵的對于具有較小域間隙的自信樣本，有時會降低模型的性能?？傊?，使用置信度來近似域的差異，并確定何時應用增強。

Stochastic Restoration

隨機恢復可以被看作是一種特殊的 Dropout 形式。在這種方法中，網(wǎng)絡通過隨機地將可訓練權重中的一小部分張量元素恢復到初始權重，以避免與初始源模型之間的差異過大，從而防止災難性遺忘的發(fā)生。此外，通過保留源模型的信息，可以訓練所有可訓練參數(shù)而不會導致模型崩潰。這種方法可以有效地平衡源模型知識的保留和新數(shù)據(jù)的學習。上面這三個內容，都可以在 CoTTA 的框架圖里找到。

實驗

首先我們看下 CoTTA 在分類任務上的表現(xiàn)，從 CIFAR10 跨域到 CIFAR10C 的結果如下表，CIFAR10C 包括了各種可能下手動增加的噪聲。

在這里插入圖片描述

下表是 CoTTA 在分割任務上的表現(xiàn)，從 Cityscapes 跨域到 ACDC，包括霧天，夜晚，雨天和雪天四種不同的情況，從左到右時間步依次增長。

在這里插入圖片描述

結論

該論文提出了一種名為 CoTTA 的新方法，用于在非平穩(wěn)環(huán)境下進行持續(xù)的測試時間適應。在這種環(huán)境中，目標域的數(shù)據(jù)分布會隨著時間的推移而不斷變化。該方法由兩個主要組成部分構成：一是使用權重平均和增強平均偽標簽來減少誤差的累積，二是通過隨機地恢復一小部分權重到源預訓練的權重，以保留源模型中的知識。CoTTA 方法可以方便地集成到現(xiàn)有的預訓練模型中，而無需訪問源數(shù)據(jù)。該方法的有效性在四個分類任務和一項針對持續(xù)測試時間適應的分割任務中得到了驗證，并且在實驗中表現(xiàn)出優(yōu)于現(xiàn)有方法的性能。通過使用權重平均和增強平均偽標簽來減少誤差累積，CoTTA 方法能夠更好地適應不斷變化的目標分布。同時，通過隨機恢復一小部分權重到源預訓練權重，CoTTA 方法能夠保留源模型中的知識，從而避免災難性遺忘的問題。這項研究為在非平穩(wěn)環(huán)境中進行持續(xù)的測試時間適應提供了一種有效的方法，并在實驗中展示了其優(yōu)越性，可以適應在一些 online 任務上。此外，在下一篇文章中我們將介紹 CVPR 2023 中的 EcoTTA: Memory-Efficient Continual Test-Time Adaptation via Self-Distilled Regularization，是基于 CoTTA 在內存上做的優(yōu)化。
責任編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

數(shù)據(jù)

數(shù)據(jù)

+關注

關注
8

文章
7035

瀏覽量
89047
感知系統(tǒng)

感知系統(tǒng)

+關注

關注
1

文章
71

瀏覽量
15952
訓練模型

訓練模型

+關注

關注
1

文章
36

瀏覽量
3828

原文標題：Continual Test-Time 的領域適應

文章出處：【微信號：GiantPandaCV，微信公眾號：GiantPandaCV】歡迎添加關注！文章轉載請注明出處。

矢量混頻器表征和混頻器測試系統(tǒng)矢量誤差修正的新方法白皮書

矢量混頻器表征和混頻器測試系統(tǒng)矢量誤差修正的新方法 白皮書本文介紹了一種表征射頻器的新方法，方法能給出輸入匹配，輸出匹配以及變頻損耗的幅度和相位響應，并適用手具有可逆變頻損耗的混頻器以

發(fā)表于 12-14 16:45

基于LabVIEW8.2提取ECG特征點的新方法

基于LabVIEW8.2提取ECG特征點的新方法1、引言目前的心電圖（ECG）還主要依賴于人工讀圖，而且對相關人員所具備的專業(yè)知識水平要求很高。在計算機自動分析識別方面，雖有研究但技術尚不成熟[1

發(fā)表于 11-30 16:52

運用于matlab中的矩陣求逆的新方法有哪些?。ú皇呛瘮?shù)inv）

運用于matlab中的矩陣求逆的新方法有哪些啊或者考慮矩陣的特殊性質，比如稀疏、對稱性，有哪些求逆的新方法可以運用?。壳笾?！

發(fā)表于 01-21 17:10

測電阻，新方法，不加激勵

測電阻，新方法，不加激勵的辦法有沒有。

發(fā)表于 03-26 10:44

一種標定陀螺儀的新方法

一種標定陀螺儀的新方法

發(fā)表于 08-17 12:17

矢量混頻器表征和混頻器測試系統(tǒng)矢量誤差修正的新方法白皮書

矢量混頻器表征和混頻器測試系統(tǒng)矢量誤差修正的新方法白皮書

發(fā)表于 08-23 12:08

使用PIM分析儀測試連接器互調的新方法是什么？

使用PIM分析儀測試連接器互調的新方法是什么？

發(fā)表于 05-10 06:59

求大佬分享按鍵掃描的新方法

求大佬分享按鍵掃描的新方法

發(fā)表于 01-17 06:50

虛擬環(huán)境中軟體的包圍盒更新方法分析

講述了軟體采用層次包圍盒方法進行碰撞檢測時，針對連續(xù)變形包圍盒樹的兩類更新方法：靜態(tài)更新和動態(tài)更新，對靜態(tài)更新方法中的自上而下、自下而上和混合更新方

發(fā)表于 08-14 08:59 ?8次下載

高精度非接觸測量轉速新方法研究

本文研究一種高精度非接觸測量轉速的新方法，用激光CCD 位移傳感器采集數(shù)據(jù)，用小波多頻分析方法對信號的低頻信號和高頻噪聲進行分離，依據(jù)奈奎斯特采樣定理將分離后的低頻

發(fā)表于 09-03 17:26 ?15次下載

虛擬環(huán)境中軟體的包圍盒更新方法分析

講述了軟體采用層次包圍盒方法進行碰撞檢測時，針對連續(xù)變形包圍盒樹的兩類更新方法：靜態(tài)更新和動態(tài)更新，對靜態(tài)更新方法中的自上而下、自下而上和混合更新方

發(fā)表于 12-25 16:25 ?13次下載

一種新的非平穩(wěn)噪聲環(huán)境下的噪聲功率譜估計方法

）基礎上，通過語音的無聲段對噪聲功率譜進行估計。該方法僅適用于信噪比較高的平穩(wěn)噪聲環(huán)境下。因為

發(fā)表于 03-13 16:17 ?19次下載

AD采集的新方法資料分享

AD采集的新方法

發(fā)表于 03-23 09:44 ?10次下載

安森美電感式位置感測新方法加快上市時間

安森美電感式位置感測新方法加快上市時間

發(fā)表于 12-21 17:34 ?1052次閱讀

VLSI系統(tǒng)設計的最新方法

電子發(fā)燒友網(wǎng)站提供《VLSI系統(tǒng)設計的最新方法.pdf》資料免費下載

發(fā)表于 11-20 11:10 ?0次下載

搜索歷史

CoTTA的新方法：用于在非平穩(wěn)環(huán)境下進行持續(xù)的測試時間適應

評論

矢量混頻器表征和混頻器測試系統(tǒng)矢量誤差修正的新方法白皮書

基于LabVIEW8.2提取ECG特征點的新方法

運用于matlab中的矩陣求逆的新方法有哪些?。ú皇呛瘮?shù)inv）

測電阻，新方法，不加激勵

一種標定陀螺儀的新方法

矢量混頻器表征和混頻器測試系統(tǒng)矢量誤差修正的新方法白皮書

使用PIM分析儀測試連接器互調的新方法是什么？

求大佬分享按鍵掃描的新方法

虛擬環(huán)境中軟體的包圍盒更新方法分析

高精度非接觸測量轉速新方法研究

虛擬環(huán)境中軟體的包圍盒更新方法分析

一種新的非平穩(wěn)噪聲環(huán)境下的噪聲功率譜估計方法

AD采集的新方法資料分享

安森美電感式位置感測新方法加快上市時間

VLSI系統(tǒng)設計的最新方法