0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI/ML應(yīng)用和處理器的架構(gòu)探索

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:嵌入式計(jì)算設(shè)計(jì) ? 2022-11-24 16:05 ? 次閱讀

人工智能應(yīng)用的架構(gòu)探索很復(fù)雜,涉及多項(xiàng)研究。首先,我們可以針對單個(gè)問題,例如內(nèi)存訪問,也可以查看整個(gè)處理器或系統(tǒng)。

行業(yè)背景

人工智能 (AI) 應(yīng)用考慮了計(jì)算、存儲(chǔ)、內(nèi)存、管道、通信接口、軟件和控制。此外,人工智能應(yīng)用程序處理可以分布在處理器內(nèi)的多核、PCIe 主干上的多個(gè)處理器板、分布在以太網(wǎng)中的計(jì)算機(jī)、高性能計(jì)算機(jī)或數(shù)據(jù)中心的系統(tǒng)。此外,AI處理器還具有巨大的內(nèi)存大小要求,訪問時(shí)間限制,跨模擬和數(shù)字的分布以及硬件 - 軟件分區(qū)。

問題

人工智能應(yīng)用的架構(gòu)探索很復(fù)雜,涉及多項(xiàng)研究。首先,我們可以針對單個(gè)問題,例如內(nèi)存訪問,也可以查看整個(gè)處理器或系統(tǒng)。大多數(shù)設(shè)計(jì)都是從內(nèi)存訪問開始的。有很多選擇 - SRAMDRAM、本地與分布式存儲(chǔ)、內(nèi)存計(jì)算以及緩存反向傳播系數(shù)與丟棄。

第二個(gè)評估扇區(qū)是總線或網(wǎng)絡(luò)拓?fù)?。虛擬原型可以具有用于處理器內(nèi)部的片上網(wǎng)絡(luò)、TileLink 或 AMBA AXI 總線、用于連接多處理器板和機(jī)箱的 PCIe 或以太網(wǎng),以及用于訪問數(shù)據(jù)中心的 Wifi/5G/Internet 路由器。

使用虛擬原型的第三個(gè)研究是計(jì)算。這可以建模為處理器內(nèi)核、多處理器、加速器、FPGA、多重累加和模擬處理。最后部分是傳感器、網(wǎng)絡(luò)、數(shù)學(xué)運(yùn)算、DMA、自定義邏輯、仲裁器、調(diào)度程序和控制函數(shù)的接口。

此外,人工智能處理器和系統(tǒng)的架構(gòu)探索具有挑戰(zhàn)性,因?yàn)樗谟布娜抗δ苌蠎?yīng)用了數(shù)據(jù)密集型任務(wù)圖。

模型構(gòu)建

在Mirabilis,我們使用VisualSim進(jìn)行AI應(yīng)用程序的架構(gòu)探索。VisualSim 的用戶在圖形離散事件仿真平臺(tái)中非??焖俚亟M裝虛擬原型,該平臺(tái)具有大型 AI 硬件和軟件建模組件庫。該原型可用于進(jìn)行時(shí)序、吞吐量、功耗和服務(wù)質(zhì)量權(quán)衡。提供超過20個(gè)AI處理器和嵌入式系統(tǒng)模板,以加速新AI應(yīng)用程序的開發(fā)。

為 AI 系統(tǒng)中的權(quán)衡生成的報(bào)告包括響應(yīng)時(shí)間、吞吐量、緩沖區(qū)占用、平均功耗、能耗和資源效率。

ADAS模型構(gòu)建

首先,讓我們考慮自動(dòng)駕駛(ADAS)應(yīng)用程序,這是圖1中的一種AI部署形式。ADAS應(yīng)用程序與計(jì)算機(jī)或電子控制單元(ECU)和網(wǎng)絡(luò)上的許多應(yīng)用程序共存。ADAS任務(wù)還依賴于現(xiàn)有系統(tǒng)的傳感器和執(zhí)行器才能正常運(yùn)行。

pYYBAGN_JdqAR5YfAAEES646J4Y549.png

圖1.汽車設(shè)計(jì)中 AI 應(yīng)用的邏輯到物理架構(gòu)

早期架構(gòu)權(quán)衡可以測試和評估假設(shè),以快速識(shí)別瓶頸,并優(yōu)化規(guī)范以滿足時(shí)序、吞吐量、功耗和功能要求。在圖 1 中,您將看到架構(gòu)模型需要硬件、網(wǎng)絡(luò)、應(yīng)用任務(wù)、傳感器、衰減器和流量激勵(lì)來了解整個(gè)系統(tǒng)的運(yùn)行情況。圖 2 顯示了映射到物理架構(gòu)的此 ADAS 邏輯架構(gòu)的實(shí)現(xiàn)。

架構(gòu)模型的一個(gè)很好的功能是能夠分離設(shè)計(jì)的所有部分,以便可以研究單個(gè)操作的性能。在圖 2 中,您會(huì)注意到單獨(dú)列出了現(xiàn)有任務(wù)、帶有 ECU 的網(wǎng)絡(luò)、傳感器生成和 ADAS 邏輯任務(wù)組織。ADAS任務(wù)圖中的每個(gè)功能都映射到ECU。

poYBAGN_JduAOSgKAADasL3DLdA433.png

圖2.將ADAS映射到ECU網(wǎng)絡(luò)的汽車系統(tǒng)的系統(tǒng)模型

自動(dòng)輔助系統(tǒng)分析

仿真圖2中的ADAS模型時(shí),您可以獲得各種報(bào)告。圖3顯示了完成ADAS任務(wù)的延遲以及電池為此任務(wù)散發(fā)的相關(guān)熱量。其他感興趣的圖可以是測量的功率、網(wǎng)絡(luò)吞吐量、電池消耗、CPU 利用率和緩沖區(qū)占用。

pYYBAGN_Jd2ALAJtAAEssesCUVA248.png

圖3.來自 ADAS 架構(gòu)模型的分析報(bào)告

處理器模型構(gòu)建

AI 處理器和系統(tǒng)的設(shè)計(jì)人員對應(yīng)用程序類型、訓(xùn)練與推理、成本點(diǎn)、功耗和大小限制進(jìn)行實(shí)驗(yàn)。例如,設(shè)計(jì)人員可以將子網(wǎng)絡(luò)分配給流水線階段,權(quán)衡深度神經(jīng)網(wǎng)絡(luò) (DNN) 與傳統(tǒng)機(jī)器學(xué)習(xí)算法,測量 GPU、TPU、AI 處理器、FPGA 和傳統(tǒng)處理器上的算法性能,評估在芯片上融合計(jì)算和內(nèi)存的優(yōu)勢,計(jì)算類似于人腦功能的模擬技術(shù)的功耗影響,以及構(gòu)建具有針對單個(gè)應(yīng)用的部分功能集的 SoC。

從PowerPoint到新AI處理器的第一個(gè)原型的時(shí)間表非常短,第一個(gè)生產(chǎn)樣品不能有任何瓶頸或錯(cuò)誤。因此,建模成為強(qiáng)制性的。

圖 4 顯示了 Google 張量處理器的內(nèi)部視圖??驁D已轉(zhuǎn)換為圖 5 中的架構(gòu)模型。處理器通過 PCIe 接口接收來自主機(jī)的請求。MM、TG2、TG3 和 TG4 是來自獨(dú)立主機(jī)的不同請求流。權(quán)重存儲(chǔ)在片外 DDR3 中,并調(diào)用到權(quán)重 FIFO 中。到達(dá)的請求在統(tǒng)一本地緩沖區(qū)中存儲(chǔ)和更新,并發(fā)送到矩陣動(dòng)車單元進(jìn)行處理。通過 AI 管道處理請求后,它將返回到統(tǒng)一緩沖區(qū)以響應(yīng)主機(jī)。

poYBAGN_Jd6AI5A2AAEnxYMrJAI651.png

圖4.來自谷歌的 TPU-1

pYYBAGN_JeGATnTXAAC7tiZxZao461.png

圖5.AI 硬件架構(gòu)的 VisualSim 模型的俯視圖

處理器模型分析

在圖 6 中,您可以查看片外 DDR3 中的延遲和反向傳播權(quán)重管理。延遲是從主機(jī)發(fā)送請求到接收響應(yīng)的時(shí)間。您將看到TG3和TG4能夠分別在200 us和350 us之前保持低延遲。MM和TG2在仿真早期開始緩沖。由于存在相當(dāng)大的緩沖,并且這組流量配置文件的延遲正在增加,因此當(dāng)前的 TPU 配置不足以處理負(fù)載和處理。TG3和TG4的優(yōu)先級(jí)較高,有助于維持更長的運(yùn)營時(shí)間。

poYBAGN_JeKAPOJEAAC7VBa4AOA020.png

圖6.架構(gòu)探索權(quán)衡的統(tǒng)計(jì)信息

汽車設(shè)計(jì)施工

poYBAGN_JeSAP5UZAABeix-IXC4742.png

圖7.帶有CAN總線、傳感器和ECU的汽車網(wǎng)絡(luò)

當(dāng)今的汽車設(shè)計(jì)融合了許多安全和自動(dòng)駕駛功能,需要大量的機(jī)器學(xué)習(xí)和推理??捎玫臅r(shí)間表將決定處理是在ECU完成還是發(fā)送到數(shù)據(jù)中心。例如,可以在本地完成制動(dòng)決策,同時(shí)可以發(fā)送更改空調(diào)溫度進(jìn)行遠(yuǎn)程處理。兩者都需要基于輸入傳感器和攝像頭的一定數(shù)量的人工智能。

圖 7 是包含 ECU、CAN-FD、以太網(wǎng)和網(wǎng)關(guān)的網(wǎng)絡(luò)框圖。

pYYBAGN_JeWAbE5-AAEkoRyFlrI302.png

圖8.自動(dòng)駕駛和E/E架構(gòu)的可視化模擬模型

圖 8 捕獲了圖 7 的一部分,該部分將 CAN-FD 網(wǎng)絡(luò)與包含多個(gè) ARM 內(nèi)核和一個(gè) GPU 的高性能 Nvidia DrivePX 集成在一起。以太網(wǎng)/TSN/AVB 和網(wǎng)關(guān)已從模型中刪除,以簡化視圖。在此模型中,重點(diǎn)是了解 SoC 的內(nèi)部行為。該應(yīng)用程序是由車輛上的攝像頭傳感器觸發(fā)的 MPEG 視頻捕獲、處理和渲染。

汽車設(shè)計(jì)分析

圖 9 顯示了 AMBA 總線和 DDR3 內(nèi)存的統(tǒng)計(jì)信息。您可以查看工作負(fù)載在多個(gè)主節(jié)點(diǎn)之間的分布情況。可以評估應(yīng)用程序管道的瓶頸,確定最高周期時(shí)間任務(wù)、內(nèi)存使用情況配置文件以及每個(gè)任務(wù)的延遲。

poYBAGN_JeeAF31RAADY4II5VjY333.png

圖9.總線和內(nèi)存活動(dòng)報(bào)告

用例和流量模式應(yīng)用于組裝為硬件、RTOS 和網(wǎng)絡(luò)組合的架構(gòu)模型。定期交通狀況用于對雷達(dá)、激光雷達(dá)和攝像頭進(jìn)行建模,而用例可以是自動(dòng)駕駛、聊天機(jī)器人、搜索、學(xué)習(xí)、推理、大數(shù)據(jù)操作、圖像識(shí)別和疾病檢測。用例和流量可以根據(jù)輸入速率、數(shù)據(jù)大小、處理時(shí)間、優(yōu)先級(jí)、依賴性、先決條件、反向傳播循環(huán)、系數(shù)、任務(wù)圖和內(nèi)存訪問而變化。通過改變屬性在系統(tǒng)模型上模擬用例。這會(huì)導(dǎo)致生成各種統(tǒng)計(jì)信息和繪圖,包括緩存命中率、管道利用率、拒絕的請求數(shù)、每條指令或任務(wù)的瓦數(shù)、吞吐量、緩沖區(qū)占用和狀態(tài)圖。

pYYBAGN_JeiAW6vAAACYtpBw9Uc610.png

圖 10.實(shí)時(shí)測量 AI 處理器的功耗

圖10顯示了系統(tǒng)和芯片的功耗。除了散熱、電池充電消耗率和電池生命周期變化外,該模型還可以捕獲動(dòng)態(tài)功率變化。該模型繪制了每個(gè)器件的狀態(tài)活動(dòng)、相關(guān)的瞬時(shí)尖峰和系統(tǒng)的平均功耗。獲得有關(guān)功耗的早期反饋有助于熱和機(jī)械團(tuán)隊(duì)設(shè)計(jì)外殼和冷卻方法。大多數(shù)機(jī)箱對每個(gè)板都有最大功率限制。這種早期的功耗信息可用于執(zhí)行架構(gòu)與性能的權(quán)衡,從而尋找降低功耗的方法。

進(jìn)一步的勘探方案

以下是一些其他示例,重點(diǎn)介紹了如何使用 AI 體系結(jié)構(gòu)模型和分析。

1. 自動(dòng)駕駛系統(tǒng),配備360度激光掃描儀、立體攝像頭、魚眼攝像頭、毫米波雷達(dá)、聲納或激光雷達(dá),通過網(wǎng)關(guān)連接的多個(gè)IEEE802.1Q網(wǎng)絡(luò)上的20個(gè)ECU連接。原型用于測試 OEM 硬件配置的功能包,以確定硬件和網(wǎng)絡(luò)要求。主動(dòng)安全措施的響應(yīng)時(shí)間是主要標(biāo)準(zhǔn)。

2. 用于學(xué)習(xí)和推理任務(wù)的人工智能處理器使用片上網(wǎng)絡(luò)主干網(wǎng)定義,該骨干網(wǎng)由 32 個(gè)內(nèi)核、32 個(gè)加速器、4 個(gè) HBM2.0、8 個(gè) DDR5、多個(gè) DMA 和全緩存一致性組成。該模型試驗(yàn)了 RISC-V、ARM Z1 和專有內(nèi)核的變體。實(shí)現(xiàn)的目標(biāo)是在鏈路上實(shí)現(xiàn) 40Gbps,同時(shí)保持低路由器頻率并重新訓(xùn)練網(wǎng)絡(luò)路由。

3. 需要 32 層深度神經(jīng)網(wǎng)絡(luò)才能將內(nèi)存從 40GB 增加到 7GB 以下。數(shù)據(jù)吞吐量和響應(yīng)時(shí)間未更改。該模型是使用行為的功能流程圖設(shè)置的,其中包含處理和反向傳播的內(nèi)存訪問。對于不同的數(shù)據(jù)大小和任務(wù)圖,該模型確定了數(shù)據(jù)的丟棄量以及各種片外DRAM大小和SSD存儲(chǔ)選項(xiàng)。任務(wù)圖通過任意數(shù)量的圖和多個(gè)輸入和輸出而變化。

4. 通用SoC,使用ARM處理器和AXI總線進(jìn)行低成本AI處理。目標(biāo)是獲得最低的每瓦功率,從而最大化內(nèi)存帶寬。乘法累加函數(shù)被卸載到矢量指令,加密到IP核,自定義算法卸載到加速器。構(gòu)建該模型的明確目的是評估不同的緩存內(nèi)存層次結(jié)構(gòu),以提高命中率和總線拓?fù)湟詼p少延遲。

5. 模數(shù)AI處理器需要對功耗進(jìn)行徹底分析,并對所達(dá)到的吞吐量進(jìn)行準(zhǔn)確分析。在該模型中,非線性控制在離散事件模擬器中建模為一系列線性函數(shù),以加快仿真時(shí)間。在本例中,對功能進(jìn)行了測試,以檢查行為并衡量真正的節(jié)能效果。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19286

    瀏覽量

    229868
  • FPGA
    +關(guān)注

    關(guān)注

    1629

    文章

    21738

    瀏覽量

    603462
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47282

    瀏覽量

    238534
收藏 人收藏

    評論

    相關(guān)推薦

    ARM發(fā)布兩款針對移動(dòng)終端的AI芯片架構(gòu):物體檢測和機(jī)器學(xué)習(xí)處理器

    ARM發(fā)布了兩款針對移動(dòng)終端的AI芯片架構(gòu),物體檢測(Object Detection,簡稱OD)處理器和機(jī)器學(xué)習(xí)(Machine Learning,簡稱ML
    的頭像 發(fā)表于 02-23 11:59 ?7392次閱讀
    ARM發(fā)布兩款針對移動(dòng)終端的<b class='flag-5'>AI</b>芯片<b class='flag-5'>架構(gòu)</b>:物體檢測和機(jī)器學(xué)習(xí)<b class='flag-5'>處理器</b>

    昇騰AI處理器:Ascend310和CANN簡介

    Ascend310 AI處理器邏輯架構(gòu)昇騰AI處理器的主要架構(gòu)組成:芯片系統(tǒng)控制CPU(Cont
    發(fā)表于 06-05 14:09 ?1.3w次閱讀
    昇騰<b class='flag-5'>AI</b><b class='flag-5'>處理器</b>:Ascend310和CANN簡介

    Alif Semiconductor宣布推出先進(jìn)的BLE和Matter無線微控制,搭載適用于AI/ML工作負(fù)載的神經(jīng)網(wǎng)絡(luò)協(xié)同處理器

    4 月 18 日 -先進(jìn)的安全、互聯(lián)、節(jié)能的人工智能和機(jī)器學(xué)習(xí)(AI/ML)微控制(MCU)和融合處理器供應(yīng)商Alif Semiconductor?今天宣布推出Balletto?系
    發(fā)表于 04-18 17:51 ?675次閱讀
    Alif Semiconductor宣布推出先進(jìn)的BLE和Matter無線微控制<b class='flag-5'>器</b>,搭載適用于<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>工作負(fù)載的神經(jīng)網(wǎng)絡(luò)協(xié)同<b class='flag-5'>處理器</b>

    多核處理器的優(yōu)點(diǎn)

    的功耗更低、計(jì)算功耗產(chǎn)生的熱量更少。多核架構(gòu)能夠使目前的軟件更出色地運(yùn)行,并創(chuàng)建一個(gè)促進(jìn)未來的軟件編寫更趨完善的架構(gòu)。盡管認(rèn)真的軟件廠商還在探索全新的軟件并發(fā)處理模式,隨著向多核
    發(fā)表于 06-20 06:47

    淺談ARM處理器架構(gòu)

    ,新的 Cortex-M處理器家族設(shè)計(jì)的非常容易使用。因此,ARM 微控制處理器在單片機(jī)和深度嵌入式系統(tǒng)市場非常成功和受歡迎。二、ARM三個(gè)系列處理器特點(diǎn)三、目前,有哪些
    發(fā)表于 08-18 12:04

    學(xué)AI的鯉躍龍門之路:AI探索技藝

    1. 學(xué)AI的出發(fā)點(diǎn):如何提取特徵(Feature)說明: AI機(jī)學(xué)習(xí)(Machine Learning)的基礎(chǔ)活動(dòng)之一就是:提取特徵(Feature extraction)。在本文裡,藉由舉例
    發(fā)表于 11-30 17:11

    ARM公版架構(gòu) 真的是麒麟處理器的槽點(diǎn)嗎?

    只要出現(xiàn)麒麟處理器,那么必定會(huì)有很多人糾結(jié)于其使用的是ARM的公版架構(gòu),或者用之作為麒麟處理器的弱點(diǎn)進(jìn)行攻擊。那么,在筆者看來,拿采用ARM公版架構(gòu)來否認(rèn)麒麟
    發(fā)表于 01-04 16:24 ?3110次閱讀
    ARM公版<b class='flag-5'>架構(gòu)</b> 真的是麒麟<b class='flag-5'>處理器</b>的槽點(diǎn)嗎?

    主流AI處理器的制程、架構(gòu)和市場發(fā)展對比分析

    小編比較了目前主流“AI處理器”的技術(shù)和市場發(fā)展,并用表格的形式列出了它們的制程、架構(gòu)及應(yīng)用。
    的頭像 發(fā)表于 02-09 09:50 ?9590次閱讀
    主流<b class='flag-5'>AI</b><b class='flag-5'>處理器</b>的制程、<b class='flag-5'>架構(gòu)</b>和市場發(fā)展對比分析

    音頻處理器架構(gòu)_音頻處理器的延時(shí)怎么調(diào)整

    本文主要闡述了音頻處理器架構(gòu)與音頻處理器延時(shí)的調(diào)整方法。
    發(fā)表于 04-09 11:01 ?5296次閱讀

    處理器架構(gòu)探索的混合創(chuàng)新

      混合處理器是電子設(shè)計(jì)行業(yè)的一項(xiàng)重大創(chuàng)新。它為架構(gòu)師提供了更多的權(quán)力,并使團(tuán)隊(duì)能夠在開發(fā)之前可視化系統(tǒng)行為。由
    的頭像 發(fā)表于 06-01 15:50 ?916次閱讀
    <b class='flag-5'>處理器</b><b class='flag-5'>架構(gòu)</b><b class='flag-5'>探索</b>的混合創(chuàng)新

    AI/ML應(yīng)用和處理器架構(gòu)探索

      1. 360度激光掃描儀、立體攝像頭、魚眼攝像頭、毫米波雷達(dá)、聲納或激光雷達(dá)的自動(dòng)駕駛系統(tǒng),通過網(wǎng)關(guān)連接到多個(gè)IEEE802.1Q網(wǎng)絡(luò)上的20個(gè)ECU。該原型用于測試 OEM 硬件配置的功能包,以確定硬件和網(wǎng)絡(luò)要求。主動(dòng)安全行動(dòng)的響應(yīng)時(shí)間是主要標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 07-08 17:03 ?1038次閱讀
    <b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>應(yīng)用和<b class='flag-5'>處理器</b>的<b class='flag-5'>架構(gòu)</b><b class='flag-5'>探索</b>

    用于處理器架構(gòu)探索的混合創(chuàng)新

      不幸的是,架構(gòu)探索未能起飛,除了在公司投入大量資源和時(shí)間的利基口袋。架構(gòu)探索一直被高度誤解,并且已經(jīng)推出了聲稱架構(gòu)
    的頭像 發(fā)表于 11-21 16:01 ?501次閱讀

    處理器架構(gòu)與指令集

    大家天天都在使用手機(jī),你知道你的手機(jī)使用的什么處理器?處理器又是何種架構(gòu)呢?今天筆者就來談?wù)?b class='flag-5'>處理器的架構(gòu)和指令集。 我們知道一臺(tái)手機(jī)最重要的
    的頭像 發(fā)表于 04-26 11:40 ?3682次閱讀
    <b class='flag-5'>處理器</b><b class='flag-5'>架構(gòu)</b>與指令集

    簡單認(rèn)識(shí)MIPS架構(gòu)處理器

    無互鎖流水級(jí)微處理器 (Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架構(gòu)處理器之一。其原理是盡量利用軟件
    的頭像 發(fā)表于 11-29 09:14 ?1954次閱讀
    簡單認(rèn)識(shí)MIPS<b class='flag-5'>架構(gòu)</b><b class='flag-5'>處理器</b>

    聯(lián)發(fā)科或?qū)⑴c英偉達(dá)開發(fā)Arm架構(gòu)AI PC處理器

    據(jù)悉,聯(lián)發(fā)科正與英偉達(dá)合作,共同開發(fā)基于Arm架構(gòu)AI PC處理器。這款新芯片預(yù)計(jì)將在第三季度完成設(shè)計(jì)定案,第四季度進(jìn)入驗(yàn)證階段。
    的頭像 發(fā)表于 05-13 10:18 ?533次閱讀