0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

涂鴉On-App AI視頻主體突出方案全新上線!自動(dòng)追蹤+智能放大,一鍵革新視頻剪輯體驗(yàn)

涂鴉開(kāi)發(fā)者 ? 2025-04-10 19:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著智能 IPC 設(shè)備(如安防攝像頭、寵物陪伴機(jī)器人、嬰兒監(jiān)視器等)日益普及,越來(lái)越多的生活場(chǎng)景被實(shí)時(shí)記錄。然而在實(shí)際使用中,由于設(shè)備安裝位置不當(dāng)、廣角鏡頭視野過(guò)大等原因,經(jīng)常會(huì)出現(xiàn)拍攝主體占比過(guò)小的問(wèn)題,導(dǎo)致"全景清晰而主體模糊",嚴(yán)重影響用戶的觀看體驗(yàn)。


一、涂鴉AI 推理模型自動(dòng)突出主體

因此,涂鴉重磅推出 On-App AI 視頻主體突出解決方案,利用涂鴉賦能 App 的AI 能力對(duì)畫面進(jìn)行實(shí)時(shí)目標(biāo)檢測(cè),自動(dòng)定位、識(shí)別主體后,再利用圖像算法對(duì)其進(jìn)行智能自適應(yīng)放大,使主體更突出、畫面更聚焦。最后,對(duì)處理完成的視頻進(jìn)行編碼與封裝,即可輸出經(jīng)過(guò)優(yōu)化的視頻內(nèi)容。


該方案適合拓展應(yīng)用至生活各個(gè)場(chǎng)景中,如:

在室內(nèi)監(jiān)護(hù)中,可用于嬰兒看護(hù)、寵物監(jiān)測(cè)、寵物機(jī)器人等設(shè)備;

在醫(yī)療影像或科研中,可結(jié)合內(nèi)鏡或其他醫(yī)療設(shè)備突出術(shù)野關(guān)鍵區(qū)域;

在戶外記錄時(shí),可用于智能喂鳥(niǎo)器、狩獵攝像機(jī)、自然景觀攝像機(jī)等設(shè)備;

在安防與工業(yè)檢測(cè)中,可用于巡檢、維修等需要檢查局部細(xì)節(jié)的設(shè)備。


a.例如針對(duì)家庭場(chǎng)景里的小貓,攝像頭會(huì)自動(dòng)識(shí)別主體并進(jìn)行畫面放大:

948192fe-15fb-11f0-9434-92fbcf53809c.png

(沒(méi)有主體突出功能的視頻畫面)

94c12036-15fb-11f0-9434-92fbcf53809c.png

(有主體突出功能的視頻畫面)

b.在戶外復(fù)雜場(chǎng)景下,涂鴉 On-App AI 視頻主體方案依然能夠精準(zhǔn)識(shí)別目標(biāo)對(duì)象,并進(jìn)行動(dòng)作追蹤和畫面放大。戳視頻,直觀體驗(yàn)生成效果:


二、詳解涂鴉AI 視頻主體突出技術(shù)

1、整體技術(shù)架構(gòu)介紹

在涂鴉所有的 AI 產(chǎn)品/硬件解決方案中, 我們打通了端到端的 AI 能力:即設(shè)備端、云端、App 端三端協(xié)同。通過(guò)將先進(jìn)的 AI 推理模型部署到涂鴉賦能 App 上,能夠助力品牌商與開(kāi)發(fā)者將先進(jìn)的AI技術(shù)無(wú)縫集成到移動(dòng)設(shè)備中,打造更靈活的 AI 架構(gòu)、更優(yōu)的用戶體驗(yàn)、更安全的計(jì)算能力。


在移動(dòng)端模型的部署中,涂鴉采用了輕量化技術(shù)架構(gòu)TensorFlow Lite 等),這種技術(shù)架構(gòu)的優(yōu)勢(shì)就在于具備高效推理、低延遲、低功耗等特點(diǎn),并且支持本地模型實(shí)現(xiàn)離線運(yùn)行、系統(tǒng)更新、部署等按需加載的機(jī)制,助力提高運(yùn)行效率,打造更靈活的 AI 架構(gòu)。

圖像處理技術(shù)涂鴉采用了 OpenGL ES,可實(shí)現(xiàn)更高效的渲染與優(yōu)化,充分利用 GPU 對(duì)圖像處理過(guò)程進(jìn)行加速;

視頻編解碼技術(shù)采用涂鴉平臺(tái)提供的硬件解碼,能夠提升視頻處理性能、降低 CPU 負(fù)載,確保視頻流暢播放與低功耗運(yùn)行。

951ad4b4-15fb-11f0-9434-92fbcf53809c.png

(涂鴉AI 視頻主體突出技術(shù)架構(gòu)圖)


2、技術(shù)亮點(diǎn)

2.1 擁有更靈活的 AI 架構(gòu):輕量化和動(dòng)態(tài)化

95352ac6-15fb-11f0-9434-92fbcf53809c.png

(輕量化與動(dòng)態(tài)化運(yùn)行流程示意圖)

2.1.1 輕量級(jí)檢測(cè)模型

涂鴉采用專門優(yōu)化移動(dòng)端的輕量級(jí)對(duì)象檢測(cè)模型 EfficientDet-D0,該模型參數(shù)少、計(jì)算量小、推理速度快,可以精準(zhǔn)檢測(cè)視頻中指定主體(如寵物、人物)的位置與類別。同時(shí),基于智能分析能力可快速篩除無(wú)主體片段,有效降低計(jì)算負(fù)擔(dān),提升處理效率。

?

2.1.2 模型動(dòng)態(tài)化

采用按需加載的動(dòng)態(tài)模型管理機(jī)制,支持模型在線下載、更新與部署,確保視頻應(yīng)用始終使用最優(yōu)模型版本,同時(shí)減少初始安裝包體積,提高運(yùn)行效率。

?

2.2 更優(yōu)的用戶體驗(yàn):實(shí)時(shí)性和高效率

9549ef1a-15fb-11f0-9434-92fbcf53809c.png(AI實(shí)時(shí)數(shù)據(jù)處理流程示意圖)?

2.2.1實(shí)時(shí)交互處理

該方案支持實(shí)時(shí)響應(yīng)用戶的交互需求。依托本地計(jì)算的高效運(yùn)行,可確保流暢無(wú)延遲的用戶體驗(yàn),無(wú)需依賴網(wǎng)絡(luò),即可實(shí)現(xiàn)快速響應(yīng)與實(shí)時(shí)處理。

?

2.2.2 新增防抖圖像算法

在檢測(cè)視頻主體位置的過(guò)程中,檢測(cè)框可能會(huì)發(fā)生抖動(dòng)偏移,從而導(dǎo)致主體放大的畫面也會(huì)產(chǎn)生抖動(dòng);針對(duì)這一問(wèn)題,涂鴉增加抖動(dòng)閾值,確保視頻處理畫面時(shí)的平滑流暢。

?

2.2.3 微調(diào)模型以提高準(zhǔn)確度

涂鴉積累了海量不同場(chǎng)景下的主體圖片,覆蓋不同光照條件下白天黑夜等多個(gè)場(chǎng)景,數(shù)據(jù)脫敏之后,涂鴉對(duì)這些模型進(jìn)行精心的訓(xùn)練微調(diào),確保模型推理過(guò)程中的泛化能力。

?

2.3 更安全的計(jì)算能力:低成本和隱私保護(hù)

955a108e-15fb-11f0-9434-92fbcf53809c.png(涂鴉 AI 端側(cè)算力結(jié)構(gòu)圖)?

2.3.1降低處理成本

涂鴉支持開(kāi)發(fā)者動(dòng)態(tài)調(diào)整視頻幀的推理策略。在沒(méi)有檢測(cè)到視頻主體的時(shí)候,系統(tǒng)會(huì)間隔多幀識(shí)別一幀;當(dāng)檢測(cè)到主體時(shí),就會(huì)自動(dòng)調(diào)整為間隔 3 幀檢測(cè)一幀。這樣就能充分利用移動(dòng)端的硬件加速,顯著提升視頻編解碼速度,降低 CPU 負(fù)載,提高整體性能。

而且,本地化處理相比云端處理的成本更低、更能節(jié)約云端負(fù)荷,算力消耗每萬(wàn)次減少 25 TFLOPs,節(jié)省成本約 10% 左右。

?

2.3.2 保護(hù)隱私安全

該方案的所有數(shù)據(jù)處理均在本地完成,顯著降低時(shí)延、提高響應(yīng)速度,同時(shí)避免數(shù)據(jù)外傳,增強(qiáng)用戶隱私保護(hù),為應(yīng)用提供更安全高效的計(jì)算環(huán)境。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34872

    瀏覽量

    277643
  • IPC
    IPC
    +關(guān)注

    關(guān)注

    3

    文章

    365

    瀏覽量

    53051
  • 涂鴉智能
    +關(guān)注

    關(guān)注

    7

    文章

    259

    瀏覽量

    19992
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    4K、多模態(tài)、長(zhǎng)視頻AI視頻生成的下個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080
    的頭像 發(fā)表于 06-16 00:13 ?5934次閱讀

    全新上線IPC精彩時(shí)刻!配套On-App AI視頻剪輯模板+全天候一鍵抓拍

    IPC精彩時(shí)刻功能,是涂鴉AI云開(kāi)發(fā)者平臺(tái)為所有帶攝像頭的智能硬件,專門打造的“AI視頻增值服務(wù)”:通過(guò)
    的頭像 發(fā)表于 05-08 19:06 ?206次閱讀
    <b class='flag-5'>全新</b><b class='flag-5'>上線</b>IPC精彩時(shí)刻!配套<b class='flag-5'>On-App</b> <b class='flag-5'>AI</b><b class='flag-5'>視頻剪輯</b>模板+全天候<b class='flag-5'>一鍵</b>抓拍

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開(kāi)發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書(shū)學(xué)習(xí)如何構(gòu)建開(kāi)發(fā)個(gè)視頻應(yīng)用。AI Agent是
    發(fā)表于 03-05 19:52

    LoRa無(wú)線一鍵報(bào)警安防建設(shè)方案

    險(xiǎn)情,不論是老人,還是小孩都可以一鍵緊急呼救,聯(lián)動(dòng)智能網(wǎng)關(guān)、手機(jī)APP等其他報(bào)警設(shè)備進(jìn)行緊急求救。方案背景:?近年來(lái),醫(yī)患關(guān)系日趨緊張,患方辱罵、傷害、毆打醫(yī)務(wù)人員
    的頭像 發(fā)表于 02-28 14:41 ?515次閱讀
    LoRa無(wú)線<b class='flag-5'>一鍵</b>報(bào)警安防建設(shè)<b class='flag-5'>方案</b>

    開(kāi)關(guān)柜一鍵順控在一鍵停電、一鍵送電中的作用

    蜀瑞創(chuàng)新為大家科普,開(kāi)關(guān)柜一鍵順控技術(shù)在一鍵停電和一鍵送電中發(fā)揮了快速響應(yīng)、減少人為錯(cuò)誤、提高安全性、簡(jiǎn)化操作流程、降低操作風(fēng)險(xiǎn)、提高送電成功率等綜合優(yōu)勢(shì),對(duì)于提升電力系統(tǒng)的運(yùn)行效率、安全性以及
    的頭像 發(fā)表于 02-27 09:13 ?606次閱讀

    行業(yè)集結(jié):共同定制 RK3566 集成 AI 眼鏡的前沿 AR 方案

    在技術(shù)革新浪潮席卷全球的當(dāng)下,智能視覺(jué)終端設(shè)備 —— 以 AI 眼鏡為典型代表,正以革命性姿態(tài)打破物理與數(shù)字世界的藩籬,在虛實(shí)交融的界面中搭建起多維度的認(rèn)知通道。 而深圳市新創(chuàng)云
    發(fā)表于 02-20 18:44

    OpenAI推出AI視頻生成模型Sora

    。用戶只需輸入自己期望的場(chǎng)景或構(gòu)思,Sora便能根據(jù)這些輸入,快速生成高清的視頻剪輯結(jié)果。這功能無(wú)疑為視頻制作領(lǐng)域帶來(lái)了革命性的變革。 通過(guò)Sora,用戶可以輕松地將腦海中的創(chuàng)意轉(zhuǎn)化為生動(dòng)的
    的頭像 發(fā)表于 12-12 09:40 ?679次閱讀

    涂鴉賦能App 6.0版本解鎖全新智能生活!單品、場(chǎng)景、車家互聯(lián)全線升級(jí)

    隨著移動(dòng)互聯(lián)網(wǎng)迎來(lái)場(chǎng)浩浩蕩蕩的AI革命浪潮,App也不再僅僅是個(gè)軟件,而是借助智能化,進(jìn)化成用戶全新
    的頭像 發(fā)表于 11-29 01:03 ?809次閱讀
    <b class='flag-5'>涂鴉</b>賦能<b class='flag-5'>App</b> 6.0版本解鎖<b class='flag-5'>全新</b><b class='flag-5'>智能</b>生活!單品、場(chǎng)景、車家互聯(lián)全線升級(jí)

    未來(lái)AIGC技術(shù)的挑戰(zhàn)與機(jī)遇

    AIGC技術(shù)能夠顯著縮短視頻內(nèi)容的制作周期。通過(guò)AI算法,可以快速生成視頻剪輯、特效、字幕和配樂(lè)等,減少人工操作的時(shí)間。例如,在短視頻制作中,AIGC技術(shù)可以
    的頭像 發(fā)表于 10-25 15:53 ?1359次閱讀

    AIGC在視頻內(nèi)容制作中的應(yīng)用前景

    AIGC技術(shù)能夠顯著縮短視頻內(nèi)容的制作周期。通過(guò)AI算法,可以快速生成視頻剪輯、特效、字幕和配樂(lè)等,減少人工操作的時(shí)間。例如,在短視頻制作中,AIGC技術(shù)可以
    的頭像 發(fā)表于 10-25 15:44 ?1758次閱讀

    LoRa無(wú)線一鍵報(bào)警安防建設(shè)系統(tǒng)

    險(xiǎn)情,不論是老人,還是小孩都可以一鍵緊急呼救,聯(lián)動(dòng)智能網(wǎng)關(guān)、手機(jī)APP等其他報(bào)警設(shè)備進(jìn)行緊急求救。 方案背景: ? 近年來(lái),醫(yī)患關(guān)系日趨緊張,患方辱罵、傷害、毆打醫(yī)務(wù)人員,圍攻醫(yī)院為保
    發(fā)表于 09-25 17:08

    一鍵斷電開(kāi)關(guān)的種類有哪些

    內(nèi)部的小電流控制大電流,達(dá)到弱電控制強(qiáng)電的目的。 特點(diǎn) :快速、安全,能夠切斷所有連接的電源,適合需要快速切斷電源的場(chǎng)景。 應(yīng)用場(chǎng)景 :家庭、辦公室、工廠等需要一鍵控制多個(gè)電源的場(chǎng)景。 2. 智能開(kāi)關(guān)式一鍵斷電 定義 :隨著
    的頭像 發(fā)表于 09-13 16:45 ?2984次閱讀

    微軟Azure AI語(yǔ)音服務(wù)革新:引入虛擬人形象,文本一鍵轉(zhuǎn)生動(dòng)視頻

    微軟于8月23日宣布,在其領(lǐng)先的Azure AI語(yǔ)音服務(wù)中融入了項(xiàng)革命性創(chuàng)新——虛擬人形象功能,此功能徹底顛覆了傳統(tǒng)交互方式,讓文本轉(zhuǎn)視頻的過(guò)程變得前所未有的直觀與生動(dòng)。
    的頭像 發(fā)表于 08-23 16:25 ?1046次閱讀

    vivo智能車載正式上線視頻類應(yīng)用

    7月15日,vivo官方正式宣告,其創(chuàng)新的智能車載系統(tǒng)OriginOS新增了項(xiàng)重大功能——“vivo智能車載”,該功能現(xiàn)已集成并上線了首批七款熱門
    的頭像 發(fā)表于 07-16 16:27 ?1543次閱讀

    智能開(kāi)關(guān)柜能如何實(shí)現(xiàn)“可視化一鍵順控”?

    智能開(kāi)關(guān)柜能如何實(shí)現(xiàn)“可視化一鍵順控”和“開(kāi)關(guān)柜健康狀態(tài)管理”?蜀瑞創(chuàng)新推出智能開(kāi)關(guān)柜一鍵順控測(cè)解決方案。建設(shè)主要包括柜內(nèi)無(wú)線溫度監(jiān)測(cè)、斷路
    的頭像 發(fā)表于 07-08 09:45 ?983次閱讀
    <b class='flag-5'>智能</b>開(kāi)關(guān)柜能如何實(shí)現(xiàn)“可視化<b class='flag-5'>一鍵</b>順控”?

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品