0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

TWINE支持編譯為wasm應用運行設計

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:Linux閱碼場 ? 2022-07-07 10:06 ? 次閱讀

提要

本期推送是對ICDE 2021 中發(fā)表的論文《TWINE:An Embedded Trusted Runtime for WebAssembly》的解讀。WebAssembly是一種越來越流行的輕量級二進制指令格式。這篇論文描述了TWINE,這是一個WebAssembly trusted runtime,它能夠支持編譯為wasm的應用運行。TWINE提供了一個安全的軟件runtime(沙箱),它嵌入在TEE中;并且提供WASI interface,通過WASI來抽象底層環(huán)境。TWINE會動態(tài)地將WASI操作翻譯為等價的OS calls和SGX中的安全的庫。特別地,作者使用TWINE實現(xiàn)了一個安全、可信的SQLite版本,這是一個眾所周知的成熟的可嵌入數(shù)據(jù)庫。作者認為這樣一個受信任的數(shù)據(jù)庫將是構建許多大型應用程序服務的合理組件。評估表明,SQLite可以通過WebAssembly和現(xiàn)有的系統(tǒng)接口在SGX enclave內(nèi)完全執(zhí)行,平均性能開銷類似。額外的安全保證及其與標準WebAssembly的完全兼容性在很大程度上彌補了性能上的損失。

研究背景

可信代碼執(zhí)行目前是分布式系統(tǒng)的主要挑戰(zhàn)之一。無論是云中的大型數(shù)據(jù)中心,還是瘦客戶機和物聯(lián)網(wǎng)設備上的網(wǎng)絡邊緣,其中存儲了許多的數(shù)據(jù)資產(chǎn)。這些數(shù)據(jù)是許多公司的關鍵資產(chǎn)。例如像Intel SGX、ARM TrustZone等等這些TEE環(huán)境(Trusted execution environment,可信執(zhí)行環(huán)境)就可以通過特殊的硬件結構為代碼安全執(zhí)行提供硬件支持,從而可以從外界環(huán)境中被保護出來,或者說隔離出來,這些外界環(huán)境包括操作系統(tǒng)和特權用戶。

然而,盡管涌現(xiàn)出了許多framework和runtime environment,為TEE編寫應用程序仍然是一項復雜的任務。開發(fā)人員通常必須使用定制的工具和api,而且僅支持少數(shù)的編程語言。所以,作者提出了支持對unmodified applications執(zhí)行的trusted runtime,這個runtime作為一個virtual machine運行在TEE中,只需將application編譯為WebAssembly,因為Wasm是不限制語言的。因為Wasm自身的一些優(yōu)點,這個trusted runtime具有執(zhí)行速度快、通用性好(支持多種語言開發(fā)的application)、安全(沙箱環(huán)境)等優(yōu)勢。

e6416576-fd88-11ec-ba43-dac502259ad0.png

圖1:研究背景示意圖

系統(tǒng)設計

作者設計的Trusted runtime是運行在TEE中的。Intel SGX 是在現(xiàn)代英特爾處理器中的一組處理器指令,程序員可以通過使用 SGX 創(chuàng)建內(nèi)存的加密區(qū)域,稱為enclaves。通過enclave內(nèi)部的指令對其中內(nèi)存內(nèi)容進行讀寫操作時會自動加密和解密。Enclave加密密鑰保存在處理器內(nèi)部,沒有任何指令可以訪問這些密鑰,即使當運行高級硬件特權級別時,操作系統(tǒng)、虛擬機管理員也無法獲取。Enclave內(nèi)的內(nèi)存受到保護,不接受任何未經(jīng)授權的訪問,甚至不接受具有物理訪問權限的機器管理員的訪問。

e65d1dac-fd88-11ec-ba43-dac502259ad0.png

圖2:SGX工作示意圖

對enclave中的內(nèi)存訪問通過一個大塊的緩存來加速,這個cache memory被稱為enclave page cache(EPC)。EPC的大小是受限的,在最新CPU中支持最大為256MB的EPC。處理器在 EPC 中保存所有 enclave page 的未加密副本,并且當 EPC 滿的時候采用分頁。并且硬件還為EPC中的所有enclave page維護加密hash表。enclave內(nèi)部的指令可以訪問enclave外部的數(shù)據(jù),但是調(diào)用enclave外部的指令需要一個特殊的out call指令(OCALL)。當調(diào)用OCALL時,CPU退出受保護的enclave,在外部執(zhí)行代碼。相反,有一個enclave call(ECALL)指令來調(diào)用enclave內(nèi)的代碼。OCALL和ECALL指令會比較慢,因為在enclave內(nèi)部和外部之間切換上下文的代價很高(在最新的服務器級處理器中,高達13’100個CPU周期)。已有的工作已經(jīng)證明,在enclave中的應用程序應該盡量避免這樣的調(diào)用,以減少性能損失。

作者提出了TWINE (Trusted Wasm in enclave),這是一個運行在TEE中的輕量級可嵌入Wasm虛擬機。圖3中描述了TWINE的workflow。它充當應用程序與底層TEE、OS和硬件之間的適配層。TWINE提供了嵌套在TEE中的安全軟件運行時(沙箱),支持WASI接口,并從應用程序中抽象出底層環(huán)境。

e66bf1c4-fd88-11ec-ba43-dac502259ad0.png

圖3:TWINE workflow

TWINE是一個適用于在TEE中運行Wasm應用程序的執(zhí)行環(huán)境。它主要由兩個主要模塊構成: Wasm runtime 和 WASI接口。Wasm runtime 完全運行在TEE內(nèi)部,作者使用的TEE是Intel SGX。作者通過利用TEE的保護來為運行Wasm application提供一個可信環(huán)境。WASI充當受信任和不受信任環(huán)境之間的橋梁,抽象出專用于與底層操作系統(tǒng)通信的機制。因此,WASI相當于由OCALLs組成的傳統(tǒng)SGX適配層。WASI能夠通過沙箱實現(xiàn)安全性。常規(guī)應用程序通常通過標準接口(例如POSIX)調(diào)用操作系統(tǒng)。WASI在Wasm操作系統(tǒng)調(diào)用和實際的操作系統(tǒng)接口之間增加了一層(薄薄的)控制層。因此,runtime環(huán)境可以自己限制各個Wasm程序所能做的事情,從而阻止Wasm代碼使用運行進程的用戶的全部權限。(例如,WASI實現(xiàn)可以將應用程序限制在文件系統(tǒng)的子樹中,這與chroot提供的功能類似。)在enclave中的代碼和數(shù)據(jù)被認為是可信的,在此之外的進程部分、操作系統(tǒng)和(任何hypervisor)都可能是敵對的、惡意的。enclave內(nèi)部的內(nèi)存只能從外部以加密的形式讀取。從外部寫入enclave會導致enclave終止。

e6887f56-fd88-11ec-ba43-dac502259ad0.png

圖4:TWINE 架構

通過WASI,能夠實現(xiàn)三重抽象:

(1)開發(fā)人員可以自由選擇編程語言,并通過compiler將它編譯為Wasm binaries。

這解除了SGX強加的限制,之前通常因為這個限制強制應用程序必須用C/C++編寫。

(2)將TEE從應用程序中抽象出來,只要TEE能夠解釋或執(zhí)行Wasm (帶有WASI支持),應用程序就可以安全執(zhí)行。

這為其他TEE技術打開了大門。

(3)WASI是與系統(tǒng)無關的,只要操作系統(tǒng)能夠提供WASI所需的等效API。

由于WASI模擬POSIX系統(tǒng)的系統(tǒng)調(diào)用,許多Unix變體都可以實現(xiàn)它。

e69b041e-fd88-11ec-ba43-dac502259ad0.png

圖5:WASI的三層抽象

作者選擇了一個已有的Wasm runtime project-WAMR來作為runtime,并修改了它的WASI接口。WAMR支持解釋器、JIT、AoT三種方式的Wasm binaries執(zhí)行。但是考慮到速度的問題,native code執(zhí)行起來比解釋器快。并且,解釋器環(huán)境相對runtime而言,占用內(nèi)存更大,這對于邊緣計算又是很重要的。因此,作者放棄了WAMR中interpreter的方式。又因為JIT方式是運行時即時編譯,需要在一個enclave中嵌進來一個JIT compiler。所以就要在enclave中引入LLVM machinery,這需要移植代碼庫來編譯SGX的限制。所以最終作者采用了AOT的方式。

WAMR中原生的對WASI的實現(xiàn),嚴重依賴于POSIX調(diào)用。POSIX在SGX enclave中不可用,因此WAMR作者編寫的WASI實現(xiàn)需要頻繁地跨越enclave的可信邊界,并使用OCALLs直接將大多數(shù)WASI函數(shù)路由到它們的POSIX等效函數(shù)。出于性能原因:大多數(shù)WASI調(diào)用將被簡單地轉換為OCALLs。其次,作者希望能夠利用其可信實現(xiàn),例如英特爾保護的文件系統(tǒng)(IPFS)。因此,作者重構了WAMR的WASI實現(xiàn),以保持其沙箱實施。

實驗評估

如圖6所示,作者使用 PolyBench/C benchmarks 來作為實驗的benchmark,展示了30個PolyBench/C (v4.2.1-beta)測試的結果。通過native執(zhí)行時間來進行標準化,比較了WAMR for wasm和TWINE for wasm in TEE的執(zhí)行時間,結果如圖所示。Wasm應用程序通常比本機應用程序慢,由于

(1)寄存器壓力增加

(2)更多的分支語句

(3)代碼大小增加等等

但是WAMR和TWINE之間的差距較小。

e6bcaac4-fd88-11ec-ba43-dac502259ad0.png

圖6:PolyBench/C benchmark的性能測試,標準化到native speed

SQLite是一個被廣泛使用的成熟的嵌入式數(shù)據(jù)庫。由于其便攜性(portability)和緊湊的尺寸(compact size),它非常適合SGX。并且SQLite能夠體現(xiàn)出性能密集型的操作和文件系統(tǒng)交互,所以作者也對它進行了評估。作者使用了SQLite自己的性能測試程序Speedtest1,運行了32個可用測試中的29個,覆蓋了大量場景。每個Speedtest1實驗都針對于數(shù)據(jù)庫的一個方面,(例如,使用多個關節(jié)進行選擇,更新索引記錄,等等)。測試由任意數(shù)量的SQL查詢組成,根據(jù)生成的負載可能會執(zhí)行多次。圖7中顯示了測試的結果,以native execution為標準進行了標準化。(其中包括內(nèi)存中配置的結果,以及使用WASI的持久化數(shù)據(jù)庫的結果。)作者在所有測試中觀察到,對于in-memory數(shù)據(jù)庫和in-file數(shù)據(jù)庫,WAMR相對于本地數(shù)據(jù)庫平均慢4.1x和3.7×。

在in-memory和in-file數(shù)據(jù)庫中,TWINE相對于WAMR的速度慢了1.7x和1.9x。

e6e97a2c-fd88-11ec-ba43-dac502259ad0.png

圖7:在SQLite Speedtest1 benchmark上的相對性能

為了更好地理解所觀察到的性能損失的來源,作者為常見的數(shù)據(jù)庫查詢設計了一套測試,包括插入、順序讀取和隨機讀取。根據(jù)對這三類操作的執(zhí)行時間分析,得出以下結果:

(1)圖8a顯示了關于插入記錄的結果。

由于額外的文件加密,使用TWINE的持久數(shù)據(jù)庫的操作成本線性增加。

(SGX-LKL在插入順序元素方面有更優(yōu)的方法,并遵循了TWINE的內(nèi)存性能趨勢。)

(2)圖8b顯示了順序讀取所有記錄的執(zhí)行時間。

作者在SGX內(nèi)存訪問中發(fā)現(xiàn)了造成這種性能損失的根本原因。

(3)圖8c描述了隨機讀取的執(zhí)行時間。

隨機讀取更加經(jīng)常地觸發(fā)enclave分頁機制,文件內(nèi)隨機讀取的例子突出了TWINE的優(yōu)點,它提供了比SGX-LKL更快的性能,EPC(enclave page cache)限制之前為1.031×,之后為1.074×。在EPC限制以上的內(nèi)存內(nèi)插入也會有類似的性能提升,增益為1.035×。

e6ff4924-fd88-11ec-ba43-dac502259ad0.png

圖8:對SQLite的插入和讀取進行性能評估

結論

這篇論文設計并實現(xiàn)了TWINE以支持編譯為wasm的應用運行。TWINE提供了一個安全的軟件runtime(沙箱),它嵌入在TEE中;并且提供WASI interface,通過WASI來抽象底層環(huán)境。評估表明,SQLite可以通過WebAssembly和現(xiàn)有的系統(tǒng)接口在SGX enclave內(nèi)完全執(zhí)行,并且平均性能開銷類似。

原文標題:思辨|WebAssembly的嵌入式可信運行時

文章出處:【微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關注

    關注

    33

    文章

    8605

    瀏覽量

    151199
  • 操作系統(tǒng)

    關注

    37

    文章

    6827

    瀏覽量

    123335
  • 數(shù)據(jù)中心

    關注

    16

    文章

    4779

    瀏覽量

    72133
  • 應用程序
    +關注

    關注

    37

    文章

    3268

    瀏覽量

    57716

原文標題:思辨|WebAssembly的嵌入式可信運行時

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Triton編譯器在機器學習中的應用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務平臺的一部分,它負責將深度學習模型轉換為優(yōu)化的格式,以便在NVIDIA GPU上高效運行。Triton編譯
    的頭像 發(fā)表于 12-24 18:13 ?346次閱讀

    Triton編譯支持的編程語言

    Triton編譯支持的編程語言主要包括以下幾種: 一、主要編程語言 Python :Triton編譯器通過Python接口提供了對Triton語言和編譯器的訪問,使得用戶可以在Pyt
    的頭像 發(fā)表于 12-24 17:33 ?332次閱讀

    Triton編譯器與其他編譯器的比較

    的GPU編程框架,使開發(fā)者能夠編寫出接近手工優(yōu)化的高性能GPU內(nèi)核。 其他編譯器 (如GCC、Clang、MSVC等): 定位:通用編譯器,支持多種編程語言,廣泛應用于各種軟件開發(fā)場景。 目標:提供穩(wěn)定、高效的
    的頭像 發(fā)表于 12-24 17:25 ?329次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個開源的編譯器前端,它支持多種編程語言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個可擴展和可定制的編譯器框架,允許開發(fā)者添加新的編程語言特性和優(yōu)化技術
    的頭像 發(fā)表于 12-24 17:23 ?356次閱讀

    HighTec C/C++編譯支持Andes晶心科技RISC-V IP

    汽車編譯器解決方案領先供貨商HighTec EDV-Systeme GmbH宣布其針對汽車市場的高度優(yōu)化C/C++編譯支持Andes晶心科技的RISC-V IP。這項支持對汽車軟件開
    的頭像 發(fā)表于 12-12 16:26 ?225次閱讀

    RISC-V編譯環(huán)境搭建

    以上按位數(shù)分可以編譯為32位和64位兩種,另外就是都可以編譯為elf版本和linux版本。
    的頭像 發(fā)表于 07-17 11:31 ?1370次閱讀
    RISC-V<b class='flag-5'>編譯</b>環(huán)境搭建

    SDK 0.95 IOT demo無法運行的原因?

    IOT example可以正常編譯,但是下載后打印出MEM CHECK FAIL!!!之后沒有任何信息,AP實際上已經(jīng)運行,能夠掃描出來。 但是 user_init 函數(shù)的打印信息沒有。 編譯環(huán)境
    發(fā)表于 07-12 15:05

    ElfBoard技術貼|如何將libwebsockets庫編譯為x86架構

    在之前的文章中,我們已經(jīng)詳細介紹了如何交叉編譯libwebsockets并將其部署到ELF1開發(fā)板上。然而在調(diào)試階段,發(fā)現(xiàn)將libwebsockets在Ubuntu環(huán)境下編譯為x86架構可能更為方便
    的頭像 發(fā)表于 07-10 09:38 ?1217次閱讀
    ElfBoard技術貼|如何將libwebsockets庫<b class='flag-5'>編譯為</b>x86架構

    為什么我的項目Debug運行沒問題,編譯成Release包就報錯?

    引言 在Android開發(fā)中,debug包和release包的行為差異可能導致release包在運行時出現(xiàn)問題,而這些問題在debug包中不會出現(xiàn)。 本文主要介紹debug包和release包的差異
    的頭像 發(fā)表于 06-12 11:18 ?950次閱讀
    為什么我的項目Debug<b class='flag-5'>運行</b>沒問題,<b class='flag-5'>編譯</b>成Release包就報錯?

    SEGGER編譯器優(yōu)化和安全技術介紹 支持最新C和C++語言

    SEGGER編譯器是專門為ARM和RISC-V微控制器設計的優(yōu)化C/C++編譯器。它建立在強大的Clang前端上,支持最新的C和C++語言功能。 除其他外,其主要功能包括: 1)?尺寸優(yōu)化:通過調(diào)整
    的頭像 發(fā)表于 06-04 15:31 ?1468次閱讀
    SEGGER<b class='flag-5'>編譯</b>器優(yōu)化和安全技術介紹 <b class='flag-5'>支持</b>最新C和C++語言

    ELF 1技術貼|如何在Ubuntu中編譯OpenCV庫

    在之前發(fā)布的文章中探討了交叉編譯OpenCV并部署至嵌入式系統(tǒng)的方法。然而,在調(diào)試階段,我們發(fā)現(xiàn)在Ubuntu環(huán)境下將OpenCV編譯為X86架構可能更加方便和高效。通過在主機上編譯并使用X86架構
    的頭像 發(fā)表于 05-31 16:41 ?1171次閱讀
    ELF 1技術貼|如何在Ubuntu中<b class='flag-5'>編譯</b>OpenCV庫

    鴻蒙開發(fā)學習:初探【ArkUI-X】

    **簡單來說,ArkTS + ArkUI-X 對標的框架為 flutter,一次代碼,編譯為 native 全平臺運行**
    的頭像 發(fā)表于 05-13 15:58 ?1040次閱讀
    鴻蒙開發(fā)學習:初探【ArkUI-X】

    OpenHarmony開發(fā)學習:【源碼下載和編譯

    本文介紹了如何下載鴻蒙系統(tǒng)源碼,如何一次性配置可以編譯三個目標平臺(`Hi3516`,`Hi3518`和`Hi3861`)的編譯環(huán)境,以及如何將源碼編譯為三個目標平臺的二進制文件。
    的頭像 發(fā)表于 04-14 09:36 ?938次閱讀
    OpenHarmony開發(fā)學習:【源碼下載和<b class='flag-5'>編譯</b>】

    【AWTK開源智能串口屏方案】MCU SDK使用與編譯運行

    本篇文章將介紹AWTK-HMI中的MCU端開發(fā)方法,包括MCUSDK常用API的說明、使用流程及如何編譯到Linux和STM32平臺。引言:AWTK-HMI是基于AWTK與AWTK-MVVM開發(fā)的低
    的頭像 發(fā)表于 02-19 12:11 ?1222次閱讀
    【AWTK開源智能串口屏方案】MCU SDK使用與<b class='flag-5'>編譯</b><b class='flag-5'>運行</b>

    Zephyr RTOS簡介及代碼下載編譯運行

    ,例如其有線程、中斷、內(nèi)存管理、IPC、驅動、網(wǎng)絡協(xié)議棧、shell、提供POSIX接口等,可以說其已經(jīng)是一個縮小版的OS了,甚至在A核也可以運行,簡單修改下添加一點用戶空間支持等特性就可以。
    的頭像 發(fā)表于 01-10 09:12 ?6216次閱讀
    Zephyr RTOS簡介及代碼下載<b class='flag-5'>編譯</b><b class='flag-5'>運行</b>