在linux多線程環(huán)境下對(duì)同一變量進(jìn)行讀寫(xiě)時(shí)，經(jīng)常會(huì)遇到讀寫(xiě)的原子性問(wèn)題，即會(huì)出現(xiàn)競(jìng)爭(zhēng)條件。為了解決多個(gè)線程對(duì)同一變量訪問(wèn)時(shí)的競(jìng)爭(zhēng)條件問(wèn)題，操作系統(tǒng)層面提供了鎖、信號(hào)量、條件變量等幾種線程同步機(jī)制。如果對(duì)變量的每次訪問(wèn)都使用上述機(jī)制，由于系統(tǒng)調(diào)用會(huì)陷入內(nèi)核空間，需要頻繁的進(jìn)行上下文切換，這就導(dǎo)致了程序的時(shí)間開(kāi)銷比較大。

自然的，我們就想到，在多線程環(huán)境中，在某些情況下是否能減少甚至避免使用系統(tǒng)調(diào)用？答案是肯定的。

如果對(duì)多線程下的變量訪問(wèn)進(jìn)行分析，可以看到，線程對(duì)變量的訪問(wèn)可以分為以下幾類：

一個(gè)線程寫(xiě)，另一個(gè)線程讀，簡(jiǎn)稱一寫(xiě)一讀
多個(gè)線程寫(xiě)，一個(gè)線程讀，簡(jiǎn)稱多寫(xiě)一讀
一個(gè)線程寫(xiě)，多個(gè)線程讀，簡(jiǎn)稱一寫(xiě)多讀。
多個(gè)線程寫(xiě)，多個(gè)線程讀，簡(jiǎn)稱多寫(xiě)多讀。

在linux 系統(tǒng)中，多個(gè)線程同時(shí)讀一個(gè)變量是不需要同步的，而多個(gè)線程同時(shí)寫(xiě)一個(gè)變量或一個(gè)線程寫(xiě)而其他線程讀某個(gè)變量，是需要同步的，可以總結(jié)為：”多讀不互斥，而讀寫(xiě)和多寫(xiě)互斥“。

由于多個(gè)線程對(duì)同一變量的讀不需要同步，因而一寫(xiě)多讀和一寫(xiě)一讀并無(wú)本質(zhì)區(qū)別，進(jìn)而可以把多線程下對(duì)變量訪問(wèn)依據(jù)是否需要同步而合并成如下三類：

一寫(xiě)多讀
多寫(xiě)一讀
多寫(xiě)多讀

解決上面所有的互斥，都可以使用系統(tǒng)調(diào)用。上面已經(jīng)提到，在某些情況下我們是可以避免使用代價(jià)高昂的系統(tǒng)調(diào)用的。而“一寫(xiě)多讀”就是這些特殊情況中的一種。

雙buffer “無(wú)鎖” 設(shè)計(jì)

使用系統(tǒng)調(diào)用進(jìn)行同步的主要問(wèn)題在于頻繁切換上下文耗時(shí)較長(zhǎng)，而后臺(tái)系統(tǒng)的處理速度又是除正確性之外最為關(guān)鍵的指標(biāo)。為提高系統(tǒng)的運(yùn)行速度，我們可以使用用其他系統(tǒng)資源來(lái)?yè)Q取時(shí)間的辦法，從而避免使用鎖之類系統(tǒng)調(diào)用。在這些方法中，最常見(jiàn)的就是用空間換取時(shí)間。

針對(duì)一寫(xiě)多讀的情況，可以使用”雙 buffer“ 及共享指針機(jī)制來(lái)實(shí)現(xiàn)對(duì)同一變量高效訪問(wèn)，同時(shí)又能保證不會(huì)出現(xiàn)競(jìng)爭(zhēng)條件。這一實(shí)現(xiàn)的技術(shù)關(guān)鍵點(diǎn)在于以下兩個(gè)方面：

雙 buffer 的備份機(jī)制，避免了同時(shí)讀寫(xiě)同一變量。雙buffer 就是指對(duì)于通常要被多個(gè)線程訪問(wèn)的變量，再額外定義一個(gè)備份變量。由于是一寫(xiě)多讀，寫(xiě)線程只向備份變量中寫(xiě)入，而所有的讀線程只需要訪問(wèn)主變量本身即可。當(dāng)寫(xiě)進(jìn)程對(duì)備份變量的寫(xiě)操作完成后，會(huì)觸發(fā)主變量指針和備份變量指針的互換操作，即指針切換，從而將原變量和備份變量的身份進(jìn)行互換，達(dá)到數(shù)據(jù)更新的目的。
共享指針 shared_ptr，由于其記錄了對(duì)變量的引用次數(shù)，因而可以避免指針切換時(shí)的“訪問(wèn)丟失”問(wèn)題。

為了便于理解，本文使用 C++ 中的 map 類型變量作為示意，當(dāng)然，本文的方法可以推廣到一寫(xiě)多讀模式下任意數(shù)據(jù)類型的更新中。使用雙 buffer 的示意圖如下：

注意ptr 和 bak_ptr 都是整個(gè)map 的指針，上面藍(lán)色箭頭表示通過(guò)兩個(gè)指針訪問(wèn) map 中的元素，ptr 和bak_ptr 本身并不指向元素。

在系統(tǒng)啟動(dòng)時(shí)，把兩個(gè)智能指針?lè)謩e初始化為一個(gè)主map 和一個(gè)備份 map。之后把全部數(shù)據(jù)更新到主map中開(kāi)始對(duì)外提供服務(wù)。當(dāng)外部需要讀取數(shù)據(jù)時(shí)(多讀），全部通過(guò)主map 的智能指針 ptr 來(lái)實(shí)現(xiàn)。而數(shù)據(jù)的更新全部通過(guò)備份map 的指針bak_ptr 來(lái)實(shí)現(xiàn)。由此可以看出，由于使用了兩個(gè)map，即雙buffer，使得數(shù)據(jù)的讀和寫(xiě)進(jìn)行了分離，互不影響，不會(huì)出現(xiàn)競(jìng)爭(zhēng)條件，避免了鎖的使用。

指針的切換

由于讀寫(xiě)分離，雙buffer機(jī)制下的數(shù)據(jù)讀寫(xiě)不會(huì)出現(xiàn)競(jìng)爭(zhēng)條件。在備份map 中數(shù)據(jù)更新完成時(shí)，必然需要一種方式，使得新數(shù)據(jù)能被使用到。這里需要做的就是把主map和備份map 的共享指針指向的內(nèi)容互換，即ptr 和bak_ptr 指向的內(nèi)容互換。指針切換如下圖所示：

那么，在指針互換時(shí)，會(huì)出現(xiàn)什么問(wèn)題呢？

在指針的切換過(guò)程中，會(huì)出現(xiàn)如下兩個(gè)問(wèn)題：

由于對(duì)主map 的讀是多線程的讀，會(huì)出現(xiàn)多線程同使用主map 共享指針ptr 的情形，而互換指針時(shí)，需要對(duì)主map 的指針進(jìn)行寫(xiě)操作，那么對(duì)同一指針 ptr 的讀和寫(xiě)的競(jìng)爭(zhēng)條件如何解決？
在準(zhǔn)備互換ptr 和 bak_ptr 指向的內(nèi)容時(shí)，如果某個(gè)讀線程正在使用 ptr 訪問(wèn)主map，直接互換就可能出現(xiàn)讀線程再通過(guò)ptr獲取數(shù)據(jù)時(shí)訪問(wèn)失效的問(wèn)題，嚴(yán)重的情況下會(huì)訪問(wèn)到無(wú)效內(nèi)存導(dǎo)致程序崩潰。這一問(wèn)題本文簡(jiǎn)稱為”指針訪問(wèn)丟失“問(wèn)題，類似于常規(guī)指針中出現(xiàn)的野指針或懸垂指針的問(wèn)題。

ptr 競(jìng)爭(zhēng)條件的解決

當(dāng)指針切換時(shí)，單線程對(duì) bak_ptr 的寫(xiě)操作已經(jīng)完成，因而對(duì)其可以隨便讀寫(xiě)。但由于多個(gè)讀線程可能還在使用ptr，切換指針時(shí)對(duì) ptr 的讀寫(xiě)就要十分的小心。為了避免對(duì) ptr 的讀寫(xiě)出現(xiàn)競(jìng)爭(zhēng)條件，本文使用了自旋鎖來(lái)對(duì)ptr 的讀寫(xiě)進(jìn)行同步。使用自旋鎖的原因有兩個(gè)：

只在指針切換時(shí)使用鎖，而不是在讀寫(xiě)兩個(gè)map 時(shí)使用鎖，因而鎖的使用頻率會(huì)非常的低，由此導(dǎo)致的上下文切換的代價(jià)是可接受的。
由于指針切換時(shí) ptr 處于的情形是一寫(xiě)多讀，指針互換準(zhǔn)備對(duì) ptr 進(jìn)行寫(xiě)操作時(shí)，要獲取鎖的等待時(shí)間并不長(zhǎng)，并不會(huì)有長(zhǎng)時(shí)間的鎖等待出現(xiàn)，因而可以使用代價(jià)更小的自旋鎖，而不是使用代價(jià)更高的讀寫(xiě)鎖。

指針訪問(wèn)丟失

上面已經(jīng)介紹了指針訪問(wèn)丟失的情形，即在兩個(gè)指針切換時(shí)，多個(gè)讀線程可能正在使用ptr。為了避免出現(xiàn)讀線程會(huì)讀取到無(wú)效數(shù)據(jù)，本文使用的方法是利用共享指針的引用計(jì)數(shù)來(lái)實(shí)現(xiàn)指針的延遲互換。

解決ptr 的競(jìng)爭(zhēng)條件和指針訪問(wèn)丟失問(wèn)題后，就可以安全的使用雙buffer 方案了。

最終的代碼如下，其中 mapptr 就是主map 指針，bakptr 是備份map 的指針：

class UpdateData {
  public:
    UpdateData():flag_(0) {
    }

    void PeriodTask();
    void SetFlag(int i) {
      flag_ = i;
    }
  private:
    shared_ptr< map > map_ptr_;
    SpinLock map_rwspinlock_;
    shared_ptr< map > bak_map_ptr_;
    int flag_;

    shared_ptr< map > GetMainMapPtr(); 
    void SetMainMapPtr(shared_ptr< map > new_map_ptr);
    void SwitchMapPtr();
    void PeriodTask();
    void GetData(shared_ptr< map > ptr) {
      ptr["abc"] = "def";
      ...
    }
};

// 獲取主map 指針
shared_ptr< map > UpdateData::GetMainMapPtr() {
  Lock(map_rwspinlock_); // 加自旋鎖，避免對(duì) ptr 訪問(wèn)出現(xiàn)競(jìng)爭(zhēng)條件
  return map_ptr_;  // 主map 指針
}

// 設(shè)置主map 指針
void UpdateData::SetMainMapPtr(shared_ptr< map > new_map_ptr) {
  Lock(map_rwspinlock_);  // 加自旋鎖，避免對(duì) ptr 訪問(wèn)出現(xiàn)競(jìng)爭(zhēng)條件
  map_ptr_ = new_map_ptr;
}

// 真正的切換指針
void UpdateData::SwitchMapPtr() {
  shared_ptr< map > old_map_ptr = GetMainMapPtr();
  SetMainMapPtr(bak_ptr_);  // 這里新數(shù)據(jù)已經(jīng)可以被使用了

  // 用引用次數(shù)來(lái)解決訪問(wèn)丟失問(wèn)題
  while (old_map_ptr.unique() {
    ::usleep(10000);  // 指針延遲互換
  }
  bak_map_ptr_ = old_map_ptr;
  bak_map_ptr_- >clear();
}


// 定時(shí)任務(wù)
void UpdateData::PeriodTask() {
    while(flag) {
      ::sleep(300); // 每5分鐘更新一次數(shù)據(jù)
      GetData(bak_ptr_); // 新數(shù)據(jù)寫(xiě)到備份 map 中
      SwitchMapPtr();
    }
}

需要注意的是，SwitchMapPtr 中調(diào)用 SetMainMapPtr(bakptr) 之后，即使程序一直處在while 循環(huán)中，再有新的線程通過(guò) mapptr 來(lái)訪問(wèn)主map 的數(shù)據(jù)時(shí)，使用的已經(jīng)是新的數(shù)據(jù)了。while 循環(huán)是為了解決指針訪問(wèn)丟失問(wèn)題。當(dāng)引用次數(shù)為1時(shí)，即 unique 為真時(shí)，表示已經(jīng)沒(méi)有讀線程再使用舊的 map 了，只剩下SwitchMapPtr 中old_map_ptr 這一個(gè)引用了，這時(shí)可以安全的釋放舊的map，并把它清空當(dāng)作備份map繼續(xù)進(jìn)行數(shù)據(jù)的更新操作。

從上面可以看出，通過(guò)使用雙buffer和共享指針，避免了在一寫(xiě)多讀模式中對(duì)數(shù)據(jù)的讀寫(xiě)頻繁加鎖，實(shí)現(xiàn)了”無(wú)鎖“ 的設(shè)計(jì)。

延伸

即然雙buffer可以很好的用于一寫(xiě)多讀模式，那么對(duì)于”多寫(xiě)一讀“或”多寫(xiě)多讀“模式，是否也可以引入雙buffer 模式呢？

在含有多線程寫(xiě)同一變量的情形下下，其實(shí)是不太適合使用雙buffer 方案的。主要原因是：

多寫(xiě)的情形下，需要在 bak_map 的多個(gè)寫(xiě)操作之間通過(guò)鎖來(lái)同步，雖然避免了對(duì)讀寫(xiě)互斥情形的加鎖，但是多線程寫(xiě)時(shí)通常對(duì)數(shù)據(jù)的實(shí)時(shí)性要求較高，如果使用雙buffer，所有新數(shù)據(jù)必須要等到指針切換時(shí)才能被使用，很可能達(dá)不到實(shí)時(shí)性要求。
多線程寫(xiě)時(shí)若用雙buffer，則在指針切換時(shí)也需要給bak_map 加鎖，并且也要用類似于上面的while 循環(huán)來(lái)保證沒(méi)有線程在執(zhí)行寫(xiě)入操作時(shí)才能進(jìn)行指針切換，而且此時(shí)也要等待多讀的完成才能進(jìn)行切換，這時(shí)就會(huì)出現(xiàn)對(duì) bak_map 的鎖定時(shí)間過(guò)長(zhǎng)，在數(shù)據(jù)更新頻繁的情況下是不合適的。

因而，在多寫(xiě)的模式下，還是優(yōu)先用讀寫(xiě)鎖等操作系統(tǒng)提供的同步機(jī)制。

結(jié)語(yǔ)

雙buffer 方案在多線程環(huán)境下能較好的解決 “一寫(xiě)多讀” 時(shí)的數(shù)據(jù)更新問(wèn)題，特別是適用于數(shù)據(jù)需要定期更新，且一次更新數(shù)據(jù)量較大的情形。而這種情形在后臺(tái)開(kāi)發(fā)中十分常見(jiàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴