0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

揭秘為什么Cloud TPU編寫(xiě)自定義估算器模型?

Tensorflowers ? 來(lái)源:未知 ? 作者:王淳 ? 2018-09-20 09:46 ? 次閱讀

文 / Google Cloud Platform 技術(shù)主管 Lak Lakshmanan (@lak_gcp)

張量處理單元 (TPU) 可加速處理 Google 內(nèi)各種機(jī)器學(xué)習(xí)工作負(fù)載,并可供 Google Cloud 客戶(hù)使用。您可以在Cloud TPU 參考模型存儲(chǔ)區(qū)找到啟用 TPU 的頂尖圖像模型版本,例如 ResNet 和 AmoebaNet;您還可以使用強(qiáng)大的Tensor2Tensor庫(kù),在 TPU 上執(zhí)行文本摘要和問(wèn)答任務(wù)。這些教程會(huì)為您分步介紹如何使用當(dāng)下很多最熱門(mén)的 Cloud TPU 參考模型。

注:存儲(chǔ)區(qū)鏈接

https://github.com/tensorflow/tpu

教程鏈接

https://cloud.google.com/tpu/docs/tutorials

但如果您擁有自定義 TensorFlow 模型,又該如何做呢?在本文中,我會(huì)逐步介紹編寫(xiě)自定義估算器以便在 Cloud TPU 上運(yùn)行的全過(guò)程。在此過(guò)程中,我會(huì)指出需要注意的地方和建議采用的最佳實(shí)踐。您可以在 GitHub 上找到此解決方案的完整代碼;本文僅列出相關(guān)代碼片段。

注:解決方案的完整代碼鏈接

https://github.com/GoogleCloudPlatform/training-data-analyst/tree/master/courses/machine_learning/deepdive/08_image/flowersmodeltpu

自定義 TensorFlow 估算器包含以模型函數(shù)傳遞的基類(lèi)估算器:

1def train_and_evaluate(output_dir, nsteps):

2estimator = tf.estimator.Estimator(

3model_fn = model_fn,

4model_dir = output_dir)

模型函數(shù)會(huì)接收特征、標(biāo)簽和模式,并返回 EstimatorSpec。例如,圖像分類(lèi)問(wèn)題的模型函數(shù)可能包含

1def model_fn(features, labels, mode):

2# write the model to compute predictions, loss, etc. from the model

3

4return tf.estimator.EstimatorSpec(

5mode=mode,

6predictions={"probabilities": probabilities,

7 "classid": class_int, "class": class_str},

8loss=loss,

9train_op=train_op,

10eval_metric_ops=evalmetrics,

11export_outputs={'classes': tf.estimator.export.PredictOutput(

12{"probabilities": probabilities, "classid": class_int,

13 "class": class_str})}

14)

TensorFlow 中的 tf.contrib.tpu 包提供了包裝器類(lèi),可助您以適當(dāng)方式編寫(xiě)代碼,以便在 CPUGPU 和 Cloud TPU 上運(yùn)行代碼。下面我們就來(lái)看看如何以這種不受加速器限制的方式編寫(xiě)自定義估計(jì)器。

1.將輸入數(shù)據(jù)轉(zhuǎn)換為 TF 記錄

Cloud TPU 的速度非???,一不小心,您的訓(xùn)練就會(huì)變成以讀寫(xiě)(“饋入” 和 “饋出”)數(shù)據(jù)和存儲(chǔ)檢查點(diǎn)為主。讓 TPU 等待輸入/輸出會(huì)造成浪費(fèi),所以我們會(huì)做幾件事以充分利用 TPU 用于計(jì)算的時(shí)間。

首先是避免在估算器的輸入函數(shù)中進(jìn)行數(shù)據(jù)解析和整理,而是預(yù)先將數(shù)據(jù)轉(zhuǎn)換為 TF 記錄。與單個(gè)圖像文件相比,批量處理 TF 記錄更為簡(jiǎn)單,因?yàn)橛涗洷旧戆瑯?biāo)簽,如此可以減少系統(tǒng)必須讀取的小型文件數(shù)量。我使用 Apache Beam 進(jìn)行這種轉(zhuǎn)換。您可以在官方 TPU 存儲(chǔ)區(qū)找到讀取 JPEG 和編寫(xiě) TF 記錄的腳本。您可以在 Cloud Dataflow 上大規(guī)模地執(zhí)行 Apache Beam 程序,但如果您的數(shù)據(jù)源目前不在 Google Cloud 上,則只能在大型 VM 上本地執(zhí)行此程序(請(qǐng)務(wù)必用 pip 安裝 apache-beam)。

注:JPEG 和編寫(xiě) TF 記錄鏈接

https://github.com/tensorflow/tpu/blob/master/tools/datasets/jpeg_to_tf_record.py

TF 記錄是字典。對(duì)于圖像分類(lèi),上述管道編寫(xiě)的兩個(gè)條目很重要,分別是:“image/class/label”(采用 int64)和 “image/encoded”(由 JPEG 文件內(nèi)容組成)。

2.編寫(xiě)輸入函數(shù)以讀取 TF 記錄

與任何估算器一樣,您需要編寫(xiě)輸入函數(shù),以讀取這些 TF 記錄。使用 Dataset API 可極大地簡(jiǎn)化此任務(wù),但還需注意幾個(gè)問(wèn)題。在講解過(guò)程中,我會(huì)指出這些問(wèn)題。

以下是我的輸入函數(shù):

1def make_input_fn(pattern, mode, num_cores=8, transpose_input=False):

2def _set_shapes(batch_size, images, labels):

3"""Statically set the batch_size dimension."""

4if transpose_input:

5images.set_shape(images.get_shape().merge_with(

6tf.TensorShape([None, None, None, batch_size])))

7labels.set_shape(labels.get_shape().merge_with(

6tf.TensorShape([batch_size])))

9else:

10images.set_shape(images.get_shape().merge_with(

11tf.TensorShape([batch_size, None, None, None])))

12labels.set_shape(labels.get_shape().merge_with(

13tf.TensorShape([batch_size])))

14return images, labels

15

16def _input_fn(params):

17batch_size = params['batch_size']

18is_training = (mode == tf.estimator.ModeKeys.TRAIN)

19

20# read the dataset

21dataset = tf.data.Dataset.list_files(pattern, shuffle=is_training)

22if is_training:

23dataset = dataset.repeat()

24def fetch_dataset(filename):

25buffer_size = 8 * 1024 * 1024 # 8 MiB per file

26dataset = tf.data.TFRecordDataset(filename, buffer_size=buffer_size)

27return dataset

28dataset = dataset.apply(

29tf.contrib.data.parallel_interleave(

30fetch_dataset, cycle_length=64, sloppy=True))

31dataset = dataset.shuffle(1024)

32

33# augment and batch

34dataset = dataset.apply(

35tf.contrib.data.map_and_batch(

36read_and_preprocess, batch_size=batch_size,

37num_parallel_batches=num_cores, drop_remainder=True

38))

39

40 if transpose_input:

41 dataset = dataset.map(

42 lambda images, labels: (tf.transpose(images, [1, 2, 3, 0]), labels),

43 num_parallel_calls=num_cores)

44

45# assign static shape

46dataset = dataset.map(

47functools.partial(_set_shapes, batch_size)

48)

49

50# prefetch data while training

51dataset = dataset.prefetch(tf.contrib.data.AUTOTUNE)

52return dataset

53

54return _input_fn

請(qǐng)注意,輸入函數(shù)采用 params 參數(shù)。實(shí)際上,這將是傳遞至訓(xùn)練程序的命令行參數(shù),如此一來(lái),我們便可提取有關(guān)數(shù)據(jù)集的詳情,例如訓(xùn)練次數(shù)和評(píng)估圖像。

batch_size 很特別,因?yàn)?TPU 有多個(gè)核心,而 batch_size 由 TPU 估算器設(shè)置,且為有效批次大小。您必須完全返回 batch_size 記錄,而不能返回部分填充的批次。由于您會(huì)無(wú)限期地循環(huán)使用訓(xùn)練數(shù)據(jù),所以在訓(xùn)練期間不會(huì)出現(xiàn)此問(wèn)題。但這意味著最簡(jiǎn)單的做法是將評(píng)估數(shù)據(jù)集向下舍入為核心數(shù)的倍數(shù)。如果核心數(shù)為 8,而評(píng)估數(shù)據(jù)集中有 1026 張圖像,您只能使用前 1024 張圖像進(jìn)行評(píng)估。剩余的 2 張圖像則會(huì)舍棄。(我們也有方法在 Cloud TPU 中處理最后剩下的部分批次,我就不在此贅述。)

與任何分布式訓(xùn)練一樣,您應(yīng)確保每個(gè)工作器看到不同的數(shù)據(jù)子集,這是由所有文件的并行交錯(cuò)及緩沖區(qū)本身內(nèi)部的記錄重排進(jìn)行處理。

圖像分類(lèi)問(wèn)題的一個(gè)常見(jiàn)需求是通過(guò)添加隨機(jī)裁剪及翻轉(zhuǎn)等方法來(lái)增強(qiáng)原始數(shù)據(jù)。我通過(guò) read_and_preprocess 函數(shù)做到這一點(diǎn)。請(qǐng)注意,我將此函數(shù)應(yīng)用于各個(gè) TF 記錄并創(chuàng)建了 8 個(gè)并行批次,同時(shí)舍棄剩余的任何記錄(再次提醒,這在訓(xùn)練期間不會(huì)造成任何影響,因?yàn)槟鷷?huì)無(wú)限期重復(fù)進(jìn)行訓(xùn)練)。

接下來(lái)是轉(zhuǎn)置數(shù)據(jù)。事實(shí)證明,在 TPU 中轉(zhuǎn)置數(shù)據(jù)以保持批次大小可以極大地提高性能。因此,我們可以根據(jù)需要采取此做法。如果我們?cè)?GPU 或 CPU 上運(yùn)行程序,則 transpose_input 標(biāo)記會(huì)變?yōu)?false。

TPU 需要靜態(tài)大小的張量。盡管我們已確保維持這種情況(通過(guò)舍棄剩余的批次),但仍需為核心 TensorFlow 編寫(xiě) Dataset API,這是更常見(jiàn)的做法。因此,我們調(diào)用一個(gè)函數(shù),將數(shù)據(jù)集中的 batch_size 從 None 改為 batch_size。

最后的優(yōu)化操作至關(guān)重要。我們需要預(yù)取數(shù)據(jù)。換句話(huà)說(shuō),當(dāng) TPU 處理一批記錄時(shí),我們會(huì)通過(guò) I/O 線(xiàn)程尋找并提取下一批次。如此一來(lái),我們便可最大限度地利用 TPU(或 GPU),而且這對(duì) CPU 沒(méi)有任何影響。

3.處理 TF 記錄

(上述)輸入函數(shù)會(huì)設(shè)置處理輸入內(nèi)容的方式,但實(shí)際的解析操作還需由名為 read_and_preprocess() 的方法執(zhí)行。此方法如下所示:

1def read_and_preprocess(example_data):

2parsed = tf.parse_single_example(example_data, {

3'image/encoded': tf.FixedLenFeature((), tf.string, ''),

4'image/class/label': tf.FixedLenFeature([], tf.int64, 1),

5})

6image_bytes = tf.reshape(parsed['image/encoded'], shape=[])

7label = tf.cast(

8tf.reshape(parsed['image/class/label'], shape=[]), dtype=tf.int32) - 1

9

10# end up with pixel values that are in the -1, 1 range

11image = tf.image.decode_jpeg(image_bytes, channels=NUM_CHANNELS)

12image = tf.image.convert_image_dtype(image, dtype=tf.float32) # 0-1

13image = tf.expand_dims(image, 0) # resize_bilinear needs batches

14

15image = tf.image.resize_bilinear(

16image, [HEIGHT + 10, WIDTH + 10], align_corners=False)

17image = tf.squeeze(image) # remove batch dimension

18image = tf.random_crop(image, [HEIGHT, WIDTH, NUM_CHANNELS])

19image = tf.image.random_flip_left_right(image)

20image = tf.image.random_brightness(image, max_delta=63.0 / 255.0)

21image = tf.image.random_contrast(image, lower=0.2, upper=1.8)

22

23

24#pixel values are in range [0,1], convert to [-1,1]

25image = tf.subtract(image, 0.5)

26image = tf.multiply(image, 2.0)

27return image, label

這里有兩個(gè)重要的注意事項(xiàng)。第一是使用 parse_single_example,因?yàn)槲覀兪菑?map() 調(diào)用此函數(shù),所以會(huì)針對(duì)單個(gè) TF 記錄調(diào)用。我們從記錄中提取相關(guān)信息(經(jīng)過(guò)編碼的圖像和標(biāo)簽),然后將其用于構(gòu)建必要的張量。第二個(gè)注意事項(xiàng)是,這些數(shù)據(jù)必須為數(shù)值。比如,我無(wú)法傳回標(biāo)簽字符串,因?yàn)?TPU 只能處理數(shù)值型數(shù)據(jù)。我們需要在預(yù)處理管道中計(jì)算標(biāo)簽索引,標(biāo)簽此時(shí)只會(huì)是整數(shù)。

4.提供輸入函數(shù)

訓(xùn)練模型之后,您需要部署此模型,并通過(guò) TF Serving 提供。以下代碼與您使用任何其他估算器時(shí)要用到的代碼相同:

1def serving_input_fn():

2# Note: only handles one image at a time

3feature_placeholders = {'image_bytes':

4tf.placeholder(tf.string, shape=())}

5image, _ = read_and_preprocess(

6tf.squeeze(feature_placeholders['image_bytes']))

7features = {

8'image': tf.expand_dims(image, 0)

9}

10return tf.estimator.export.ServingInputReceiver(features, feature_placeholders)

TPU 已針對(duì)批次推理進(jìn)行優(yōu)化;如果您的用例需要在線(xiàn)預(yù)測(cè),目前最好是通過(guò) CPU 或 GPU 提供(根據(jù)批次大小和模型復(fù)雜程度而定)。編寫(xiě)輸入函數(shù)時(shí),我假定自己只傳送一張圖像,所以實(shí)際上是指通過(guò) CPU/GPU 提供。

5.模型函數(shù)

模型函數(shù)需要?jiǎng)?chuàng)建并返回 TPUEstimatorSpec。實(shí)現(xiàn)方式如下所示:

1def image_classifier(features, labels, mode, params):

2image = features

3if isinstance(features, dict):

4image = features['image']

5

6ylogits, nclasses = cnn_model(image, mode, params)

7

8probabilities = tf.nn.softmax(ylogits)

9class_int = tf.cast(tf.argmax(probabilities, 1), tf.int32)

10class_str = tf.gather(LIST_OF_LABELS, class_int)

11

12if mode == tf.estimator.ModeKeys.TRAIN or mode == tf.estimator.ModeKeys.EVAL:

13loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(

14logits=ylogits, labels=tf.one_hot(labels, nclasses)))

15

16def metric_fn(class_int, labels):

17return {'accuracy': tf.metrics.accuracy(class_int, labels)}

18evalmetrics = (metric_fn, [class_int, labels])

19

20if mode == tf.estimator.ModeKeys.TRAIN:

21# this is needed for batch normalization, but has no effect otherwise

22update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)

23optimizer = tf.train.AdamOptimizer(learning_rate=params['learning_rate'])

24if params['use_tpu']:

25optimizer = tf.contrib.tpu.CrossShardOptimizer(optimizer) # TPU change 1

26with tf.control_dependencies(update_ops):

27train_op = optimizer.minimize(loss, tf.train.get_global_step())

28else:

29train_op = None

30else:

31loss = None

32train_op = None

33evalmetrics = None

34

35return tf.contrib.tpu.TPUEstimatorSpec( # TPU change 2

36mode=mode,

37predictions={"probabilities": probabilities,

38"classid": class_int, "class": class_str},

39loss=loss,

40train_op=train_op,

41eval_metrics=evalmetrics,

42export_outputs={'classes': tf.estimator.export.PredictOutput(

43{"probabilities": probabilities, "classid": class_int,

44"class": class_str})}

45)

所傳入的特征可能會(huì)是圖像(我的訓(xùn)練和評(píng)估輸入函數(shù))或字典(我的提供輸入函數(shù))。我進(jìn)行檢查并從特征中檢索圖像。

然后,我在圖像上調(diào)用實(shí)際模型數(shù)學(xué)函數(shù)。這應(yīng)該是使用 tf.layers 的常見(jiàn) TensorFlow 代碼。請(qǐng)瀏覽完整的源代碼以了解其形式。

由于這是分類(lèi)問(wèn)題,所以我使用 softmax 并根據(jù)各個(gè)類(lèi)別的 logit 計(jì)算整數(shù)標(biāo)簽和字符串標(biāo)簽,之后使用了 argmax 和 gather。我還計(jì)算了交叉熵?fù)p失,這與任何其他估算器類(lèi)似。

其中一個(gè)區(qū)別在于,一般的估算器需要將評(píng)估指標(biāo)用作字典,而 TPUEstimator 需要能夠在控制 CPU 或 TPU 上調(diào)用的函數(shù)。因此,指定 eval 指標(biāo)的方式稍有不同。

如果您使用 TPU,則所用的優(yōu)化器必須包裝在 CrossShardOptimizer 中。這樣可以在不同核心中分配優(yōu)化任務(wù)。

訓(xùn)練操作就是將此交叉碎片優(yōu)化損失最小化。請(qǐng)使用 optimizer.minimize(),而非 layers.optimize_loss()。

將上述所有操作整合在一起后,系統(tǒng)會(huì)返回 TPU 估算器規(guī)范。

6.訓(xùn)練和評(píng)估循環(huán)

您可能很熟悉估算器的 train_and_evaluate 循環(huán)。可惜此循環(huán)(尚)無(wú)法與 TPU 有效配合使用。幸運(yùn)的是,創(chuàng)建您自己的循環(huán)并不太難,這讓您可以更好地控制檢查頻率和內(nèi)容(回想這樣的情景,您想盡可能減少過(guò)于頻繁的檢查導(dǎo)致的環(huán)境切換和 I/O 開(kāi)銷(xiāo))。

1def train_and_evaluate(output_dir, hparams):

2STEPS_PER_EVAL = 1000

3max_steps = hparams['train_steps']

4eval_batch_size = min(1024, hparams['num_eval_images'])

5eval_batch_size = eval_batch_size - eval_batch_size % 8 # divisible by num_cores

6tf.logging.info('train_batch_size=%d eval_batch_size=%d max_steps=%d',

7hparams['train_batch_size'],

8eval_batch_size,

9max_steps)

10

11# TPU change 3

12if hparams['use_tpu']:

13tpu_cluster_resolver = tf.contrib.cluster_resolver.TPUClusterResolver(

14hparams['tpu'],

15zone=hparams['tpu_zone'],

16project=hparams['project'])

17config = tf.contrib.tpu.RunConfig(

18cluster=tpu_cluster_resolver,

19model_dir=output_dir,

20save_checkpoints_steps=STEPS_PER_EVAL,

21tpu_config=tf.contrib.tpu.TPUConfig(

22iterations_per_loop=STEPS_PER_EVAL,

23per_host_input_for_training=True))

24else:

25config = tf.contrib.tpu.RunConfig()

26

27estimator = tf.contrib.tpu.TPUEstimator( # TPU change 4

28model_fn=image_classifier,

29config=config,

30params=hparams,

31model_dir=output_dir,

32train_batch_size=hparams['train_batch_size'],

33eval_batch_size=eval_batch_size,

34use_tpu=hparams['use_tpu']

35)

首先,提取一些命令行參數(shù),并用其指定最大步數(shù)以及訓(xùn)練和評(píng)估的批次大小。

接下來(lái)是尋找 TPU。如果您已在 Google 計(jì)算引擎上自行創(chuàng)建了 Cloud TPU,可能已為其命名。假設(shè)此名稱(chēng)(“tpu”)作為命令行參數(shù)傳入。如果您使用 Cloud ML Engine,系統(tǒng)會(huì)自動(dòng)推斷 TPU 名稱(chēng)和區(qū)域等內(nèi)容。請(qǐng)務(wù)必僅在已設(shè)置 use_tpu 標(biāo)記的情況下執(zhí)行此操作。如果用戶(hù)是在 CPU 或 GPU 上運(yùn)行程序,則只需創(chuàng)建空白 RunConfig。

接下來(lái),使用模型函數(shù)、配置、參數(shù)和批次大小創(chuàng)建 TPUEstimator。創(chuàng)建估算器后,我們便可進(jìn)入真實(shí)訓(xùn)練和評(píng)估循環(huán):

1# load last checkpoint and start from there

2current_step = load_global_step_from_checkpoint_dir(output_dir)

3steps_per_epoch = hparams['num_train_images'] // hparams['train_batch_size']

4tf.logging.info('Training for %d steps (%.2f epochs in total). Current'

5' step %d.',

6max_steps,

7max_steps / steps_per_epoch,

8current_step)

9

10start_timestamp = time.time() # This time will include compilation time

11

12while current_step < hparams['train_steps']:

13# Train for up to steps_per_eval number of steps.

14# At the end of training, a checkpoint will be written to --model_dir.

15next_checkpoint = min(current_step + STEPS_PER_EVAL, max_steps)

16estimator.train(input_fn=train_input_fn, max_steps=next_checkpoint)

17current_step = next_checkpoint

18tf.logging.info('Finished training up to step %d. Elapsed seconds %d.',

19next_checkpoint, int(time.time() - start_timestamp))

20

21# Evaluate the model on the most recent model in --model_dir.

22# Since evaluation happens in batches of --eval_batch_size, some images

23# may be excluded modulo the batch size. As long as the batch size is

24# consistent, the evaluated images are also consistent.

25tf.logging.info('Starting to evaluate at step %d', next_checkpoint)

26eval_results = estimator.evaluate(

27input_fn=eval_input_fn,

28steps=hparams['num_eval_images'] // eval_batch_size)

29tf.logging.info('Eval results at step %d: %s', next_checkpoint, eval_results)

30

31elapsed_time = int(time.time() - start_timestamp)

32tf.logging.info('Finished training up to step %d. Elapsed seconds %d.',

33max_steps, elapsed_time)

TensorFlow 估算器的運(yùn)作方式是從先前已有的檢查點(diǎn)執(zhí)行暖啟動(dòng)。我們可以加載輸出目錄中提供的檢查點(diǎn),以進(jìn)行復(fù)制。然后,我們會(huì)一次性逐步完成訓(xùn)練數(shù)據(jù) train_batch_size 步驟,直至達(dá)到所指定的最大步數(shù)。

在本文的例子中,我對(duì)完整評(píng)估數(shù)據(jù)集中的每個(gè)檢查點(diǎn)都進(jìn)行了評(píng)估,但顯然,您可以減少此訓(xùn)練的計(jì)算量。

7.導(dǎo)出模型以供使用

最后,在完成訓(xùn)練后,我導(dǎo)出已保存的模型。您可以使用 TF Serving 或 Cloud ML Engine 來(lái)部署已保存的模型,以進(jìn)行預(yù)測(cè)。

1# export similar to Cloud ML Engine / TF Serving convention

2tf.logging.info('Starting to export model.')

3estimator.export_savedmodel(

4export_dir_base=os.path.join(output_dir, 'export/exporter'),

5serving_input_receiver_fn=serving_input_fn)

此時(shí),我們便有了一個(gè)可以在 Cloud TPU 上訓(xùn)練的自定義估算器模型。采用這種方式編寫(xiě)模型(例如使用 use_tpu 標(biāo)記并提供轉(zhuǎn)置為可選項(xiàng)),同樣的代碼也支持各種不同的硬件,包括 CPU 和 GPU 在內(nèi)。因此,我們的估算器模型實(shí)際可用于全部的三類(lèi)硬件。

后續(xù)步驟:

  • 從 GitHub 下載本文隨附的代碼,然后進(jìn)行試用

  • 運(yùn)行代碼實(shí)驗(yàn)室,了解如何在 TPU 上運(yùn)行 ResNet訓(xùn)練您自己的數(shù)據(jù)(無(wú)需編寫(xiě)任何代碼)

注:代碼鏈接

https://github.com/GoogleCloudPlatform/training-data-analyst/tree/master/courses/machine_learning/deepdive/08_image/flowersmodeltpu

在 TPU 上運(yùn)行 ResNet 鏈接

https://codelabs.developers.google.com/codelabs/tpu-resnet/#0

在 Coursera 上參加使用 TensorFlow 進(jìn)行機(jī)器學(xué)習(xí)專(zhuān)業(yè)課程;此課程會(huì)逐步介紹 TensorFlow 概念,以及如何在 Google Cloud 上大規(guī)模地訓(xùn)練、調(diào)整和部署 ML 模型。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)區(qū)域
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7176
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    143

    瀏覽量

    20757
  • Cloud
    +關(guān)注

    關(guān)注

    0

    文章

    68

    瀏覽量

    5370

原文標(biāo)題:如何為 Cloud TPU 編寫(xiě)自定義估算器模型

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于YOLOv8實(shí)現(xiàn)自定義姿態(tài)評(píng)估模型訓(xùn)練

    Hello大家好,今天給大家分享一下如何基于YOLOv8姿態(tài)評(píng)估模型,實(shí)現(xiàn)在自定義數(shù)據(jù)集上,完成自定義姿態(tài)評(píng)估模型的訓(xùn)練與推理。
    的頭像 發(fā)表于 12-25 11:29 ?2891次閱讀
    基于YOLOv8實(shí)現(xiàn)<b class='flag-5'>自定義</b>姿態(tài)評(píng)估<b class='flag-5'>模型</b>訓(xùn)練

    STATCOM自定義建模及動(dòng)穩(wěn)態(tài)調(diào)壓分析

    STATCOM自定義建模及動(dòng)穩(wěn)態(tài)調(diào)壓分析:建立了statcom基于功率注入法的穩(wěn)態(tài)模型和基于受控電流源的動(dòng)態(tài)模型,并利用電力系統(tǒng)分析軟件提供的用戶(hù)自定義功能實(shí)現(xiàn)了這些
    發(fā)表于 03-18 16:09 ?18次下載

    自定義函數(shù)測(cè)試學(xué)習(xí)工程

    自定義函數(shù)測(cè)試學(xué)習(xí)工程
    發(fā)表于 07-01 16:37 ?5次下載

    SOPC中自定義外設(shè)和自定義指令性能分析

    SOPC中自定義外設(shè)和自定義指令性能分析 NiosII是一個(gè)建立在FPGA上的嵌入式軟核處理,靈活性很強(qiáng)。作為體現(xiàn)NiosII靈活性精髓的兩個(gè)最主要方面,自
    發(fā)表于 03-29 15:12 ?1624次閱讀
    SOPC中<b class='flag-5'>自定義</b>外設(shè)和<b class='flag-5'>自定義</b>指令性能分析

    1602自定義字符

    1602液晶能夠顯示自定義字符,能夠根據(jù)讀者的具體情況顯示自定義字符。
    發(fā)表于 01-20 15:43 ?1次下載

    DOS下自定義時(shí)間重啟

    DOS環(huán)境下,C語(yǔ)言編寫(xiě)自定義時(shí)間重啟。
    發(fā)表于 03-16 09:40 ?6次下載

    RTWconfigurationguide基于模型設(shè)計(jì)—自定義

    基于模型設(shè)計(jì)—自定義目標(biāo)系統(tǒng)配置指南,RTW自動(dòng)代碼生成相關(guān)資料。
    發(fā)表于 05-17 16:41 ?3次下載

    AVR編寫(xiě)1602自定義字符

    AVR編寫(xiě)自定義字符不錯(cuò)的練習(xí)題目
    發(fā)表于 03-20 14:21 ?1次下載

    如何制作自定義控制

    在您擁有自己的自定義模塊控制,完美地工作用于Gamecube模擬的PC!
    的頭像 發(fā)表于 09-04 09:33 ?5346次閱讀
    如何制作<b class='flag-5'>自定義</b>控制<b class='flag-5'>器</b>

    自定義視圖組件教程案例

    自定義組件 1.自定義組件-particles(粒子效果) 2.自定義組件- pulse(脈沖button效果) 3.自定義組件-progress(progress效果) 4.
    發(fā)表于 04-08 10:48 ?14次下載

    ArkUI如何自定義彈窗(eTS)

    自定義彈窗其實(shí)也是比較簡(jiǎn)單的,通過(guò)CustomDialogController類(lèi)就可以顯示自定義彈窗。
    的頭像 發(fā)表于 08-31 08:24 ?2246次閱讀

    labview自定義控件

    labview自定義精美控件
    發(fā)表于 05-15 16:46 ?18次下載

    自定義算子開(kāi)發(fā)

    一個(gè)完整的自定義算子應(yīng)用過(guò)程包括注冊(cè)算子、算子實(shí)現(xiàn)、含自定義算子模型轉(zhuǎn)換和運(yùn)行含自定義op模型四個(gè)階段。在大多數(shù)情況下,您的
    的頭像 發(fā)表于 04-07 16:11 ?2838次閱讀
    <b class='flag-5'>自定義</b>算子開(kāi)發(fā)

    labview超快自定義控件制作和普通自定義控件制作

    labview超快自定義控件制作和普通自定義控件制作
    發(fā)表于 08-21 10:32 ?13次下載

    NVIDIA NeMo加速并簡(jiǎn)化自定義模型開(kāi)發(fā)

    如果企業(yè)希望充分發(fā)揮出 AI 的力量,就需要根據(jù)其行業(yè)需求量身定制的自定義模型。
    的頭像 發(fā)表于 07-26 11:17 ?783次閱讀
    NVIDIA NeMo加速并簡(jiǎn)化<b class='flag-5'>自定義</b><b class='flag-5'>模型</b>開(kāi)發(fā)