0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Google Cloud集成API實現(xiàn)視頻智能檢測識別

LiveVideoStack ? 來源:LiveVideoStack ? 2023-01-13 09:40 ? 次閱讀

首先介紹一下脈時云。脈時云主要從事谷歌云的出海業(yè)務(wù),協(xié)助出海用戶做視頻和游戲,為用戶提供解決方案和日常的技術(shù)支持,提供專業(yè)的咨詢服務(wù)、遷移服務(wù)和運維服務(wù)。同時,我們也根據(jù)客戶需求自研了產(chǎn)品賬單系統(tǒng),幫助客戶使用GCP。

01 CloudVideoIntelligenceAPI介紹

首先,介紹Cloud Video Intelligence API。

741a75f8-92d6-11ed-bfe3-dac502259ad0.jpg

在GCP上不需要過多的配置,可以通過SDK,比如Python或Go,來調(diào)用API,實現(xiàn)對視頻對象、地理位置和動作捕獲的分析。

然后,可以實現(xiàn)幀級別、鏡頭級別和視頻級別的視頻元數(shù)據(jù)采集,其中,幀級別可以達到秒級。

同時,我們也支持流式視頻和基于對象的事件觸發(fā),這意味著我們可以基于事件的觸發(fā)方式根據(jù)云原生的服務(wù)構(gòu)建出流式的數(shù)據(jù)分析。

此外,我們可以基于內(nèi)容實現(xiàn)精彩片段、標(biāo)簽功能等,打造優(yōu)質(zhì)客戶體驗。

74397052-92d6-11ed-bfe3-dac502259ad0.jpg

這個API可以實現(xiàn)的功能如圖所示。首先,它可以識別鏡頭切換,當(dāng)鏡頭從A對象轉(zhuǎn)向B對象時,其可以識別出來。

然后,可以根據(jù)內(nèi)容進行標(biāo)簽化處理、實現(xiàn)目標(biāo)跟蹤和Logo識別,目前可以識別兩萬種以上的Logo。

同時,還可以做到視頻文字內(nèi)容識別和音頻轉(zhuǎn)錄,達到字幕識別的效果。

此外,還可以做到人臉檢測與識別和人物識別,在日常生活中,這主要用于交通識別和小區(qū)出入的牌照識別。

最后,還可以做到露骨內(nèi)容檢測。

74569eca-92d6-11ed-bfe3-dac502259ad0.jpg

接下來具體介紹每個功能,首先是鏡頭切換識別?;阽R頭切換識別功能,可以對整個視頻、片段視頻或幀級別的視頻進行內(nèi)容摘要方面的分析。

獲得摘要后,可以基于摘要生成縮略圖,或基于摘要判斷視頻內(nèi)容情況。

74742d6e-92d6-11ed-bfe3-dac502259ad0.jpg

其次,可以基于視頻獲取標(biāo)簽。圖中展示的demo分析了動物世界中的場景,可以看到,獲取的標(biāo)簽有動物世界、樹、葉子、動物等。

同時,可以對特定的片段進行識別和分析。此外,可以選擇不同的模式,比如整段視頻或幀級別的視頻。

748f5f30-92d6-11ed-bfe3-dac502259ad0.jpg

接下來,介紹目標(biāo)跟蹤功能。圖中的右下角有一個螞蚱,可以使用目標(biāo)跟蹤功能識別該對象,然后打開對應(yīng)的時間段進行標(biāo)記,通過標(biāo)簽關(guān)聯(lián)和識別框?qū)σ曨l進行識別。

74aa7086-92d6-11ed-bfe3-dac502259ad0.jpg

Logo識別功能可以識別出常見的Logo,比如Google Maps。同時,可以基于識別的數(shù)據(jù)信息實現(xiàn)視頻的標(biāo)簽化和數(shù)據(jù)的收集。

74c40eba-92d6-11ed-bfe3-dac502259ad0.jpg

如圖所示,可以識別視頻中出現(xiàn)的文字。完成文本識別后,可以進行標(biāo)簽化處理。同時,可以進行關(guān)聯(lián)操作,實現(xiàn)真實的影像識別。

74e3c5e8-92d6-11ed-bfe3-dac502259ad0.jpg

音頻轉(zhuǎn)錄功能基于谷歌的API,可以自動識別常見的語言,并將其轉(zhuǎn)錄為視頻文字,基于此完成字幕要求。

75061f94-92d6-11ed-bfe3-dac502259ad0.jpg

露骨內(nèi)容識別功能可以基于API對視頻的前十幀進行分析,判斷視頻是否包含敏感內(nèi)容。

同時,該功能也可對幀、視頻流和視頻片段進行分析,判斷其是否包含敏感信息。

02VideoIntelligenceAPI Beta 功能

接下來,介紹目前API預(yù)先發(fā)布的一些功能。

750b29b2-92d6-11ed-bfe3-dac502259ad0.jpg

第一個功能是流式傳輸。首先,將預(yù)存的文件組合成一定大小的文件,以視頻流的方式傳給API,API會對其進行分析和標(biāo)簽化處理,還會檢測鏡頭變化、創(chuàng)建元數(shù)據(jù)信息和跟蹤對象。

同時,可以基于另一個API實現(xiàn)動態(tài)內(nèi)容的跟蹤與識別,比如在體育賽事中,識別運動員的進球動作等。

7521ea12-92d6-11ed-bfe3-dac502259ad0.jpg

第二個功能是直播,可以對常見的直播的視頻流,比如RTMP,進行實時流式分析和標(biāo)簽化檢測。

同時,將內(nèi)容放在對象存儲或谷歌的BigQuery里,實現(xiàn)元數(shù)據(jù)的管理,并基于事件的方式實現(xiàn)視頻內(nèi)容的分析和識別。最后,根據(jù)標(biāo)簽和內(nèi)容向客戶推薦相關(guān)視頻。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1502

    瀏覽量

    62107
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4797

    瀏覽量

    84756
  • GCP
    GCP
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    2579

原文標(biāo)題:借助Video Intelligence API實現(xiàn)視頻智能檢測識別

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    基于Google Map Api的Android導(dǎo)航應(yīng)用

    本文提出并實現(xiàn)了一種基于Google Map Api 的Android 導(dǎo)航應(yīng)用,能夠給用戶提供人性化和智能化的地圖導(dǎo)航服務(wù)。
    發(fā)表于 11-21 15:09 ?5236次閱讀

    Google Home可通過聲音識別不同用戶

    導(dǎo)讀:當(dāng)你家里的其他人問智能助手的時候,Google Home會識別他們的聲音, 有關(guān)個人助理的智能家居音箱令人沮喪的事情之一就是它們并不個人化。對這些
    發(fā)表于 04-26 09:24

    50多種適合機器學(xué)習(xí)和預(yù)測應(yīng)用的API,你的選擇是?(2018年版本)

    語言識別與自然語言處理技術(shù)將視聽內(nèi)容轉(zhuǎn)化為主題元數(shù)據(jù)。語言翻譯1.Google Cloud Translation:該API能夠動態(tài)地在數(shù)千種語言之間對文本進行翻譯,且允許將網(wǎng)站和程序
    發(fā)表于 05-03 16:41

    50個機器學(xué)習(xí)實用API干貨

    個大型云API市場)上很流行。Google Cloud Natural Language API:這個API可以分析文本的結(jié)構(gòu)和含義,包括情
    發(fā)表于 10-06 08:00

    基于Google Map Api怎么實現(xiàn)Android導(dǎo)航應(yīng)用?

    的應(yīng)用成為了研究熱點之一。在目前大部分智能手機都提供GPS 定位服務(wù)以及3G 無線網(wǎng)絡(luò)越來越普及的雙重驅(qū)動下,在Google 地圖中實現(xiàn)導(dǎo)航服務(wù),是具有可行性的。
    發(fā)表于 03-20 06:21

    怎么實現(xiàn)一種基于Google Map Api的Android導(dǎo)航應(yīng)用?

    本文提出并實現(xiàn)了一種基于Google Map Api 的Android 導(dǎo)航應(yīng)用,能夠給用戶提供人性化和智能化的地圖導(dǎo)航服務(wù)。
    發(fā)表于 05-25 06:43

    如何使用Google Cloud評估板來連接到Google Cloud IoT平臺?

    如何使用Google Cloud評估板作為物聯(lián)網(wǎng)傳感器端點,來連接到Google Cloud IoT平臺?
    發(fā)表于 06-15 08:03

    谷歌推出視頻智能API 自動識別物體

    該名為視頻智能(Video Intelligence)的API將可以讓開發(fā)者開發(fā)能夠自動識別視頻中的物體的應(yīng)用程序。到目前為止,多數(shù)類似的在
    發(fā)表于 05-05 05:52 ?2671次閱讀

    基于Google Cloud運行的NVIDIA CloudXR

    上創(chuàng)造輝煌,通過演示展示基于 Google Cloud 運行的 NVIDIA CloudXR。 該視頻片段展示了一位佩戴無約束式 VR 頭顯設(shè)備的藝術(shù)家使用 Masterpiece Studio
    的頭像 發(fā)表于 08-13 14:10 ?1736次閱讀

    基于WiFi的智能手表(使用 Google API

    電子發(fā)燒友網(wǎng)站提供《基于WiFi的智能手表(使用 Google API).zip》資料免費下載
    發(fā)表于 11-04 15:10 ?1次下載
    基于WiFi的<b class='flag-5'>智能</b>手表(使用 <b class='flag-5'>Google</b> <b class='flag-5'>API</b>)

    使用 Renesas AE-CLOUD2 將 GPS 數(shù)據(jù)發(fā)送到 Google Cloud IoT

    使用 Renesas AE-CLOUD2 將 GPS 數(shù)據(jù)發(fā)送到 Google Cloud IoT
    的頭像 發(fā)表于 01-04 11:17 ?693次閱讀

    使用通用傳感器APIGoogle進行用戶活動識別

    電子發(fā)燒友網(wǎng)站提供《使用通用傳感器APIGoogle進行用戶活動識別.zip》資料免費下載
    發(fā)表于 06-19 15:25 ?0次下載
    使用通用傳感器<b class='flag-5'>API</b>和<b class='flag-5'>Google</b>進行用戶活動<b class='flag-5'>識別</b>

    Google Cloud 線上課堂 | Google Cloud 遷移最佳實踐

    以下文章來源于谷歌云服務(wù),作者 Google Cloud 立即預(yù)約 長按識別/掃描 右方二維碼 預(yù)約觀看直播 各行各業(yè)的組織都積極將業(yè)務(wù)遷移到云端,但同時發(fā)現(xiàn),無論單個本地應(yīng)用,還是跨多個
    的頭像 發(fā)表于 11-28 17:45 ?524次閱讀

    NVIDIA宣布將以API形式提供Omniverse? Cloud

    NVIDIA Omniverse Cloud API 使開發(fā)者能夠?qū)?Omniverse 技術(shù)集成到其設(shè)計與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 09:45 ?472次閱讀

    全新NVIDIA Omniverse Cloud API有何亮點?

    NVIDIA Omniverse Cloud API 使開發(fā)者能夠?qū)?Omniverse 技術(shù)集成到其設(shè)計與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 13:42 ?477次閱讀