国产尤物精品自在拍视频首页,日韩性无码国产精品专区,亚洲欧美成人网

在今年的 I/O 大會上，我們很高興宣布推出一個基于嵌入向量的全新設(shè)備端搜索庫，讓您在幾毫秒的時間內(nèi)即可從數(shù)百萬個數(shù)據(jù)樣本中快速找到相似的圖像、文本或音頻。

此搜索庫通過使用模型，將搜索查詢嵌入到表示查詢語義的高維向量中來執(zhí)行搜索。隨后搜索庫使用 ScaNN（可擴(kuò)容最近鄰算法）從預(yù)定義的數(shù)據(jù)庫中搜索相似項(xiàng)目。為將搜索庫應(yīng)用到您的數(shù)據(jù)集，您需要使用 Model Maker Searcher API（教程）構(gòu)建自定義 TFLite Searcher 模型，然后使用 Task Library Searcher API（視覺/文本）將其部署到設(shè)備上。

ScaNN

https://github.com/google-research/google-research/tree/master/scann
教程

https://tensorflow.google.cn/lite/tutorials/model_maker_text_searcher
視覺

https://tensorflow.google.cn/lite/inference_with_metadata/task_library/image_searcher
文本

https://tensorflow.google.cn/lite/inference_with_metadata/task_library/text_searcher

例如，使用在 COCO 上訓(xùn)練的 Searcher 模型，搜索查詢：“A passenger plane on the runway”，系統(tǒng)將返回以下圖像：

COCO

https://cocodataset.org/#home

圖 1：所有圖像均來自 COCO 2014 訓(xùn)練和驗(yàn)證數(shù)據(jù)集。圖像 1 由 Mark Jones Jr. 依據(jù)《版權(quán)歸屬許可證》提供。圖像 2 由 305 Seahill 依據(jù)《版權(quán)歸屬-禁止演繹許可證》提供。圖像 3 由 tataquax 依據(jù)《版權(quán)歸屬-相同方式共享許可證》提供。

在本文中，我們將向您介紹使用新 TensorFlow Lite Searcher Library 構(gòu)建文本到圖像搜索功能的端到端示例（根據(jù)給定文本查詢檢索圖像）。以下是主要步驟：

1. 使用 COCO 數(shù)據(jù)集訓(xùn)練用于圖像和文本查詢編碼的雙編碼器模型。

2. 使用 Model Maker Searcher API 創(chuàng)建文本到圖像 Searcher 模型。

3. 使用 Task Library Searcher API 檢索帶有文本查詢的圖像。

訓(xùn)練雙編碼器模型

圖 2：用點(diǎn)積相似距離訓(xùn)練雙編碼器模型。損失函數(shù)可為相關(guān)圖像和文本賦予更大的點(diǎn)積（陰影綠色方塊）

雙編碼器模型由圖像編碼器和文本編碼器組成。兩個編碼器分別將圖像和文本映射到高維空間中的嵌入向量。雙編碼器模型計算圖像和文本嵌入向量之間的點(diǎn)積，同時損失函數(shù)可為相關(guān)圖像和文本賦予更大的點(diǎn)積（更接近），而為不相關(guān)的圖像和文本賦予更小的點(diǎn)積（更遠(yuǎn)）。

整個訓(xùn)練過程受到了 CLIP 論文和本 Keras 示例的啟發(fā)。圖像編碼器是在預(yù)訓(xùn)練 EfficientNet 模型的基礎(chǔ)上構(gòu)建而成，而文本編碼器則是基于預(yù)訓(xùn)練通用語句編碼器模型。

CLIP

https://arxiv.org/abs/2103.00020
Keras 示例

https://keras.io/examples/nlp/nl_image_search/
EfficientNet

https://hub.tensorflow.google.cn/google/imagenet/efficientnet_v2_imagenet21k_ft1k_s/feature_vector/2
通用語句編碼器

https://hub.tensorflow.google.cn/google/universal-sentence-encoder-lite/2

系統(tǒng)隨后會將兩個編碼器的輸出投影到 128 維空間并進(jìn)行 L2 歸一化。對于數(shù)據(jù)集，我們選擇使用 COCO，因?yàn)樵摂?shù)據(jù)集的訓(xùn)練和驗(yàn)證分塊會為每個圖像人工生成字幕。請查看配套的 Colab notebook，了解訓(xùn)練過程的詳細(xì)信息。

Colab notebook

https://colab.sandbox.google.com/github/tensorflow/tflite-support/blob/master/tensorflow_lite_support/examples/colab/on_device_text_to_image_search_tflite.ipynb

雙編碼器模型可以從沒有字幕的數(shù)據(jù)庫中檢索圖像，因?yàn)樵诮?jīng)過訓(xùn)練后，圖像嵌入器可以直接從圖像中提取語義，而無需人工生成的字幕。

使用 Model Maker 創(chuàng)建文本

到圖像 Searcher 模型

圖 3：使用圖像編碼器生成圖像嵌入向量，并使用 Model Maker 創(chuàng)建 TFLite Searcher 模型

完成對雙編碼器模型的訓(xùn)練后，我們可以使用它來創(chuàng)建 TFLite Searcher 模型，該模型可根據(jù)文本查詢，從圖像數(shù)據(jù)集中搜索最相關(guān)的圖像。模型創(chuàng)建分為以下三大步驟：

1. 使用 TensorFlow 圖像編碼器生成圖像數(shù)據(jù)集的嵌入向量。ScaNN 能夠搜索非常龐大的數(shù)據(jù)集，因此我們結(jié)合了 COCO 2014 的訓(xùn)練和驗(yàn)證分塊（總計超過 12.3 萬張圖像），以展示其搜索性能。相關(guān)代碼請查閱此處（1）。

2. 將 TensorFlow 文本編碼器模型轉(zhuǎn)換為 TFLite 格式。相關(guān)代碼請查閱此處（2）。

3. 使用 Model Maker，通過 TFLite 文本編碼器和使用以下代碼的圖像嵌入向量創(chuàng)建 TFLite Searcher 模型：

此處（1）

https://colab.sandbox.google.com/github/tensorflow/tflite-support/blob/master/tensorflow_lite_support/examples/colab/on_device_text_to_image_search_tflite.ipynb#scrollTo=Bp0qBKkyu4jA
此處（2）

https://colab.research.google.com/github/tensorflow/tflite-support/blob/master/tensorflow_lite_support/examples/colab/on_device_text_to_image_search_tflite.ipynb#scrollTo=6Dzye66Xc8vE

#Configure ScaNN options. See the API doc for how to configure ScaNN. 
scann_options = searcher.ScaNNOptions(
      distance_measure='dot_product',
      tree=searcher.Tree(num_leaves=351, num_leaves_to_search=4),
      score_ah=searcher.ScoreAH(1, anisotropic_quantization_threshold=0.2))

# Load the image embeddings and corresponding metadata if any.
data = searcher.DataLoader(tflite_embedder_path, image_embeddings, metadata)

# Create the TFLite Searcher model.
model = searcher.Searcher.create_from_data(data, scann_options)

# Export the TFLite Searcher model.
model.export(
      export_filename='searcher.tflite',
      userinfo='',
      export_format=searcher.ExportFormat.TFLITE)

請在此處查閱上方代碼中提到的 API doc。

API doc

https://tensorflow.google.cn/lite/api_docs/python/tflite_model_maker/searcher/ScaNNOptions

在創(chuàng)建 Searcher 模型時，Model Maker 利用 ScaNN 將嵌入向量編入索引。嵌入向量數(shù)據(jù)集首先被分為多個子集。在每個子集中，ScaNN 存儲嵌入向量的量化表征。在檢索時，ScaNN 會選擇一些最相關(guān)的分區(qū)，并按照快速近似距離對量化表征進(jìn)行評分。這個過程既（通過量化）節(jié)省了模型大小又（通過分區(qū)選擇）實(shí)現(xiàn)了加速。請參閱深入研究資料，詳細(xì)了解 ScaNN 算法。

在上方示例中，我們將數(shù)據(jù)集劃分為 351 個分區(qū)（約是我們擁有的嵌入向量數(shù)量的平方根），并在檢索期間搜索其中的 4 個分區(qū)，即大約是數(shù)據(jù)集的 1%。我們還將 128 維浮點(diǎn)嵌入向量量化為 128 個 int8 值，以節(jié)省空間。

使用 Task Library 運(yùn)行推理

圖 4：使用帶有 TFLite Searcher 模型的 Task Library 運(yùn)行推理。推理接收查詢文本并返回最近鄰的元數(shù)據(jù)。我們可以在此找到對應(yīng)的圖像

如要使用 Searcher 模型查詢圖像，您只需使用 Task Library 的幾行代碼即可，具體如下所示：

from tflite_support.task import text

# Initialize a TextSearcher object
searcher = text.TextSearcher.create_from_file('searcher.tflite')

# Search the input query
results = searcher.search(query_text)

# Show the results
for rank in range(len(results.nearest_neighbors)):
  print('Rank #', rank, ':')
  image_id = results.nearest_neighbors[rank].metadata
  print('image_id: ', image_id)
  print('distance: ', results.nearest_neighbors[rank].distance)
  show_image_by_id(image_id)

可以嘗試一下 Colab 的代碼。此外，歡迎查看更多信息，了解如何使用 Task Library Java 和 C++ API 集成模型，尤其是在 Android 上的用法。在 Pixel 6 上，每個查詢通常只需要 6 毫秒。

更多信息

https://tensorflow.google.cn/lite/inference_with_metadata/task_library/text_searcher

以下是一些示例結(jié)果：

查詢：A man riding a bike

根據(jù)估算的相似距離對結(jié)果進(jìn)行排序。以下是檢索到的圖像示例。請注意，我們僅會顯示附有圖像使用許可的圖像。

圖 5：所有圖像均來自 COCO 2014 訓(xùn)練和驗(yàn)證數(shù)據(jù)集。圖像 1 由 Reuel Mark Delez 依據(jù)《版權(quán)歸屬許可證》提供。圖像 2 由 Richard Masoner/Cyclelicious 依據(jù)《版權(quán)歸屬-相同方式共享許可證》提供。圖像 3 由 Julia 依據(jù)《版權(quán)歸屬-相同方式共享許可證》提供。圖像 4 由 Aaron Fulkerson 依據(jù)《版權(quán)歸屬-相同方式共享許可證》提供。圖像 5 由 Richard Masoner/Cyclelicious 依據(jù)《版權(quán)歸屬-相同方式共享許可證》提供。圖像 6 由 Richard Masoner/Cyclelicious 依據(jù)《版權(quán)歸屬-相同方式共享許可證》提供。

研究展望

我們將致力于啟用除圖像和文本之外的更多搜索類型，如音頻片段。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3643

瀏覽量
134517
API

API

+關(guān)注

關(guān)注
2

文章
1501

瀏覽量
62017
向量

向量

+關(guān)注

關(guān)注
0

文章
55

瀏覽量
11665

原文標(biāo)題：使用 TensorFlow Lite Searcher Library 實(shí)現(xiàn)設(shè)備端文本到圖像搜索

文章出處：【微信號：tensorflowers，微信公眾號：Tensorflowers】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

HAL庫在嵌入式系統(tǒng)中的應(yīng)用

HAL庫（Hardware Abstraction Layer Library，硬件抽象層庫）在嵌入式系統(tǒng)中扮演著至關(guān)重要的角色。以下是HAL庫在嵌

發(fā)表于 12-02 11:32 ?545次閱讀

夸克學(xué)術(shù)搜索受熱捧，成年輕人PC端AI應(yīng)用首選

近日，夸克發(fā)布了一款全新的“學(xué)術(shù)搜索”AI產(chǎn)品，旨在通過先進(jìn)的AI技術(shù)和億級學(xué)術(shù)文獻(xiàn)資源，為學(xué)術(shù)工作者提供更為高效的信息獲取、創(chuàng)作和處理服務(wù)。這一創(chuàng)新產(chǎn)品的推出，無疑為學(xué)術(shù)界注入了新的活力。據(jù)

發(fā)表于 11-19 11:23 ?402次閱讀

OpenAI推出ChatGPT搜索功能

近日，OpenAI再次邁出了重要的一步，為其廣受好評的ChatGPT平臺添加了一項(xiàng)全新的搜索功能。據(jù)悉，這項(xiàng)被命名為“ChatGPT搜索”的新功能，將為用戶帶來前所未有的搜索體驗(yàn)。以

發(fā)表于 11-04 10:34 ?345次閱讀

OpenAI在ChatGPT增添搜索功能

近日，OpenAI宣布為其旗艦產(chǎn)品ChatGPT增添全新的搜索功能，此舉標(biāo)志著該公司對Alphabet旗下谷歌的直接挑戰(zhàn)進(jìn)一步升級。OpenAI周四正式揭曉了這一名為“ChatGPT搜索”的新功能

發(fā)表于 11-01 17:01 ?380次閱讀

科技云報到：大模型時代下，向量數(shù)據(jù)庫的野望

科技云報到：大模型時代下，向量數(shù)據(jù)庫的野望

發(fā)表于 10-14 17:18 ?257次閱讀

鴻蒙開發(fā)：應(yīng)用組件跨設(shè)備交互（流轉(zhuǎn)）【跨端遷移】

跨端遷移的核心任務(wù)是將應(yīng)用的當(dāng)前狀態(tài)（包括頁面控件、狀態(tài)變量等）無縫遷移到另一設(shè)備，從而在新設(shè)備上無縫接續(xù)應(yīng)用體驗(yàn)。這意味著用戶在一臺設(shè)備上進(jìn)行的操作可以在另一臺

發(fā)表于 06-11 17:10 ?1260次閱讀

大模型卷價格，向量數(shù)據(jù)庫“卷”什么？

被大模型“帶飛”這一年，向量數(shù)據(jù)庫才剛剛寫下序言

發(fā)表于 05-23 09:24 ?1781次閱讀

OpenAI正在為ChatGPT開發(fā)全新的搜索功能

OpenAI近日傳來令人振奮的消息，其正在為旗下明星產(chǎn)品ChatGPT研發(fā)一項(xiàng)全新的搜索功能。據(jù)悉，這項(xiàng)功能將極大地拓寬ChatGPT的應(yīng)用范圍，并為用戶帶來更為全面、準(zhǔn)確的回答。

發(fā)表于 05-10 11:18 ?539次閱讀

搭載英偉達(dá)GPU，全球領(lǐng)先的向量數(shù)據(jù)庫公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫

在美國硅谷圣何塞召開的 NVIDIA GTC 大會上，全球領(lǐng)先的向量數(shù)據(jù)庫公司 Zilliz 發(fā)布了 Milvus 2.4 版本。這是一款革命性的向量數(shù)據(jù)庫系統(tǒng)，在業(yè)界首屈一指，它首次

發(fā)表于 04-01 14:33 ?481次閱讀

與NVIDIA深度參與GTC，向量數(shù)據(jù)庫大廠Zilliz與全球頂尖開發(fā)者共迎AI變革時刻

近日，備受關(guān)注的 NVIDIA GTC 已拉開序幕。來自世界各地的頂尖 AI 開發(fā)者齊聚美國加州圣何塞會議中心，共同探索行業(yè)未來，全球領(lǐng)先的向量數(shù)據(jù)庫公司 Zilliz 也不例外。作為去年被

發(fā)表于 03-26 11:01 ?412次閱讀

STM32F429的工程標(biāo)準(zhǔn)庫移植到HAL庫后中斷向量表異常的原因？

STM32F429的工程標(biāo)準(zhǔn)庫移植到HAL庫后中斷向量表異常

發(fā)表于 03-20 06:02

Aurix TC2752的中端機(jī)制是怎么樣的？有無固定的中端向量標(biāo)號和中端地址啊？

AurixTC2752的中端機(jī)制是怎么樣的？有無固定的中端向量標(biāo)號和中端地址??？是類似于飛思卡爾或者28335那樣的嗎？

發(fā)表于 02-05 06:33

什么是中斷向量偏移，為什么要做中斷向量偏移？

當(dāng)MCU中有兩段或以上程序的時候（第一個程序?yàn)橛脩鬊ootLoader程序，其他的為APP程序，這個在前期視頻《什么是ISP？什么是IAP》中有講過），APP程序中都需要做中斷向量偏移，那么什么是中斷向量偏移，為什么要做中斷向量

發(fā)表于 01-30 09:47 ?1793次閱讀

蘋果翻新設(shè)備集體訴訟賠償翻番：每人獲賠26.18美元

該案中的翻新設(shè)備違約投訴，源自于蘋果在其美國地區(qū)維修條款和條件中明文規(guī)定，其可以在為客戶的產(chǎn)品提供維修和保養(yǎng)服務(wù)時使用全新或是相近表現(xiàn)和穩(wěn)定性的翻新部件或設(shè)備。但原告堅決反對，宣稱翻新或“再制造”的

發(fā)表于 01-17 10:47 ?656次閱讀

騰訊云把向量數(shù)據(jù)庫“卷”到哪一步了？

被大模型“帶飛”這一年，向量數(shù)據(jù)庫才剛剛寫下序言

發(fā)表于 01-15 09:49 ?1588次閱讀