0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)倉中搭建細(xì)粒度容災(zāi)應(yīng)用的主要步驟

馬哥Linux運維 ? 來源:cnblogs ? 2024-02-22 11:19 ? 次閱讀

前言

適用版本:【8.2.1.210及以上】

當(dāng)前數(shù)倉承載的客戶業(yè)務(wù)越來越多,從而導(dǎo)致客戶對于數(shù)倉的可靠性要求不斷增加。尤其在金融領(lǐng)域,容災(zāi)備份機(jī)制是信息系統(tǒng)必須提供的能力之一。本文介紹了在云上環(huán)境的雙集群(不跨Region不跨VPC)后臺手動部署并使用細(xì)粒度容災(zāi)的主要步驟,使得用戶能快速方便得搭建起細(xì)粒度容災(zāi)。

2. 細(xì)粒度容災(zāi)簡介

對于MPPDB集群的容災(zāi)而言,目前業(yè)界的常見方案要么是部署兩套規(guī)格配置同等的集群,要么通過邏輯雙加載方式去實現(xiàn),這兩個方案缺點比較明顯,存在架構(gòu)復(fù)雜、建設(shè)成本高等問題,不僅使得災(zāi)備部署難度增大,還導(dǎo)致資源浪費。在此背景下,GaussDB(DWS)基于列存表實現(xiàn)細(xì)粒度容災(zāi)能力,既滿足核心分析型業(yè)務(wù)在極端場景的業(yè)務(wù)連續(xù)性要求,同時也能大幅降低容災(zāi)方案的建設(shè)成本,而且容災(zāi)架構(gòu)輕量化,容災(zāi)系統(tǒng)易運維、易操作、易演練,從而幫助用戶迅捷、經(jīng)濟(jì)、按需構(gòu)建核心業(yè)務(wù)的容災(zāi)系統(tǒng)。

相比于傳統(tǒng)的容災(zāi)方案,細(xì)粒度容災(zāi)有以下優(yōu)勢:

主集群和備集群雙活(Active-Active)(備集群除災(zāi)備表只讀外,其余表可讀寫)

主備集群只需滿足DN整數(shù)倍關(guān)系,降低備集群建設(shè)資源,方便靈活部署

利用列存表的數(shù)據(jù)和元數(shù)據(jù)分離的特點,通過元數(shù)據(jù)邏輯同步 + 數(shù)據(jù)物理同步的方式,同步增量,結(jié)合UDF的增量抽取/回放接口,保障表級數(shù)據(jù)一致性

粒度可控,支持表級、schema級、庫級容災(zāi)

支持表DDL,部分DCL元數(shù)據(jù)同步,達(dá)到切換可用

細(xì)粒度容災(zāi)示意圖

703ff178-d0a2-11ee-a297-92fbcf53809c.png

3. 容災(zāi)前準(zhǔn)備

3.1 配置互信

前提條件

確保ssh服務(wù)打開。

確保ssh端口不會被防火墻關(guān)閉。

確保所有機(jī)器節(jié)點間網(wǎng)絡(luò)暢通。

配置互信

依次登錄主備集群各節(jié)點沙箱外,執(zhí)行步驟2-4。

將主集群和備集群所有節(jié)點ip和hostname添加到/home/Ruby/.ssh/authorized_keys和/var/chroot/home/Ruby/.ssh/authorized_keys的from列表中。

將主集群和備集群所有節(jié)點ip和hostname的映射添加到/etc/hosts和/var/chroot/etc/hosts文件中。

遍歷主集群和備集群所有節(jié)點ip和hostname,執(zhí)行以下命令。

ssh-keyscan -t rsa -T 120 ${ip/hostname} >> /home/Ruby/.ssh/known_hosts
ssh-keyscan -t rsa -T 120 ${ip/hostname} >> /var/chroot/home/Ruby/.ssh/known_hosts

校驗互信

從主集群任一節(jié)點能免密ssh到備集群任一節(jié)點且從備集群任一節(jié)點能免密ssh到主集群任一節(jié)點,即代表互信已配置成功。

3.2 配置容災(zāi)配置文件

Ruby用戶分別登錄主備集群主節(jié)點沙箱內(nèi)。

創(chuàng)建容災(zāi)目錄,假設(shè)目錄為/DWS/data2/finedisaster。mkdir -p /DWS/data2/finedisaster

在/DWS/data2/finedisaster目錄下,創(chuàng)建容災(zāi)配置文件backupRestore.ini和主備集群倒換配置文件sw_backupRestore.ini。

注意:

細(xì)粒度容災(zāi)的容災(zāi)備份過程支持與物理細(xì)粒度備份業(yè)務(wù)并行執(zhí)行??赏ㄟ^以下措施隔離:

兩個備份任務(wù)指定不同的metadata目錄和media目錄,實現(xiàn)備份數(shù)據(jù)隔離。容災(zāi)備份目錄通過容災(zāi)配置文件(backupRestore.ini和sw_backupRestore.ini)中的參數(shù)primary-media-destination和primary-metadata-destination指定。

細(xì)粒度容災(zāi)的容災(zāi)備份端口與物理細(xì)粒度備份的master-port指定為不同的值,實現(xiàn)備份進(jìn)程端口的隔離。容災(zāi)的備份端口通過容災(zāi)配置文件(backupRestore.ini和sw_backupRestore.ini)中的參數(shù)backup-port指定。

容災(zāi)配置文件backupRestore.ini

以下是backupRestore.ini文件示例,可根據(jù)具體業(yè)務(wù)場景修改配置參數(shù)值。

# Configuration file for SyncDataToStby tool
# The backup life cycle
life-cycle=10m
# The table that records backups info
backuprestoreinfo-file=backuprestoreinfo.csv
# The cluster user name for cluster
username=Ruby
# The primary cluster env set
primary-env=
# The standby cluster env set
standby-env=
# Time interval between each full backup, uint: min
full-backup-exec-time-interval=N/A
# Time interval between each backup
backup-exec-time-interval=2
# One of the backup hosts
primary-host-ip=XXX.XXX.XXX.XX
# The media type that restore backup files, DISK
media-type=disk
# The number of process that should be used. Range is (1~32)
parrallel-process=4
# The compression level that should be used for backup. Range(0~9)
compression-level=1
compression-type=2
# Media destination where the backup must be stored
primary-media-destination=/DWS/data2/finedisaster/mediadata
# Metadata destination where the metadata must be stored
primary-metadata-destination=/DWS/data2/finedisaster/metadata
# The master-port in which the backup must be executed
backup-port=XXXX
# Logging level for the log contents of backup:FATAL,ERROR,INFO,DEBUG
primary-cluster-logging-level=INFO
# Time interval between each restore, uint: min
restore-interval=2
# One of the restore hosts
restore-host-ip=XXX.XXX.XXX.XX
# Media destination where the backup contents must be stored in the standby cluster
restore-media-destination=/DWS/data2/finedisaster/mediadata
# Metadata destination where the backup contents must be stored in the standby cluster
restore-metadata-destination=/DWS/data2/finedisaster/metadata
# The master-port in which the restore must be executed
restore-port=XXXX
# Logging level for the log contents of restore
standby-cluster-logging-level=INFO
# The maximum number of log files that should be created. Range is (5~1024).
log-file-count=50
# The retry times of checking cluster balance for resuem backup or double clusters
check-balance-retry-times=0
# cluster id
primary-cluster-id=11111111-1111-1111-1111-111111111111
standby-cluster-id=22222222-2222-2222-2222-222222222222
# Processes tables for which fine-grained disaster recovery is no longer performed
# Value should be 'none', 'log-desync-table', 'drop-desync-table'
desync-table-operation=drop-desync-table
# Number of CPU cores that can be used by each DR process. Range is (1~1024).
cpu-cores=8
# The max number of rch files that can be reserved on master cluster before sent to standby cluster. 0 means no limit.
local-reserve-file-count=160

主備集群倒換配置文件sw_backupRestore.ini相比于backupRestore.ini只需顛倒下列參數(shù)

primary-host-ip / restore-host-ip

backup-port / restore-port

primary-media-destination / restore-media-destination

primary-metadata-destination / restore-metadata-destination

primary-cluster-id / standby-cluster-id

配置文件主要參數(shù)說明

參數(shù)名 參數(shù)含義
username 執(zhí)行雙集群腳本的OS用戶,設(shè)置成GaussDB(DWS)集群相同的OS用戶
primary-env 主集群的環(huán)境變量存儲文件的絕對路徑
standby-env 備集群的環(huán)境變量存儲文件的絕對路徑
backup-exec-time-interval 增量備份周期
primary-host-ip 主集群執(zhí)行備份的節(jié)點ip
compression-type 備份文件的壓縮算法類型
compression-level 備份文件的壓縮級別
primary-media-destination 主集群上存放備份文件的絕對路徑
primary-metadata-destination 主集群上備份元數(shù)據(jù)的絕對路徑
backup-port Roach主代理備份進(jìn)程的執(zhí)行端口
restore-interval 恢復(fù)周期
restore-host-ip 備集群執(zhí)行恢復(fù)的節(jié)點ip
restore-media-destination 備集群存放主集群同步的備份文件的路徑
restore-metadata-destination 備集群存放主集群同步的元數(shù)據(jù)信息的路徑
restore-port 恢復(fù)進(jìn)程執(zhí)行端口
primary-cluster-id 指定主集群的UUID
standby-cluster-id 指定備集群的UUID
new-disaster-recovery-suppressed-time-windows 指定主集群不發(fā)起新一輪備份的時間窗口
desync-table-operation 指定不再進(jìn)行細(xì)粒度容災(zāi)的表,在備集群上的處理方式
cpu-cores 指定容災(zāi)每個進(jìn)程能使用的cpu核數(shù)
local-reserve-file-count 在發(fā)送到備用群集之前,可以在主群集上保留的最大rch文件數(shù)。0表示無限制。

3.3 主備集群準(zhǔn)備

Ruby用戶登錄主集群主節(jié)點沙箱內(nèi)。

設(shè)置集群GUC參數(shù)。

local-dn-num為本集群DN數(shù),remote-dn-num為對方集群DN數(shù),可替換為實際值。

python3 $GPHOME/script/DisasterFineGrained.py -t prepare --local-dn-num 6 --remote-dn-num 3 --config-file /DWS/data2/finedisaster/backupRestore.ini
3.4 容災(zāi)表數(shù)據(jù)準(zhǔn)備

主集群連接數(shù)據(jù)庫,準(zhǔn)備容災(zāi)表數(shù)據(jù)。

新建容災(zāi)表

create table schema1.table_1(id int, name text) with (orientation = column, colversion="2.0", enable_disaster_cstore="on", enable_delta=false) DISTRIBUTE BY hash(id);

存量表(非容災(zāi)表)轉(zhuǎn)為容災(zāi)表

alter table schema1.table_1 set (enable_disaster_cstore='on');
--查詢表的分布方式
select pclocatortype from pg_catalog.pgxc_class where pcrelid = 'schema1.table_1'::oid limit 1;
--若表的分布方式為H(HASH分布),獲取一個hash表的分布列,后續(xù)以'id'列分布為例
select pg_catalog.getdistributekey('schema1.table_1');
--對表做重分布
alter table schema1.table_1 DISTRIBUTE BY HASH(id);
--若表的分布方式為N(ROUNDROBIN分布),對表做重分布
alter table schema1.table_1 DISTRIBUTE BY ROUNDROBIN;
--若表的分布方式為R(REPLICATION分布),對表做重分布
alter table schema1.table_1 DISTRIBUTE BY REPLICATION;

4. 細(xì)粒度容災(zāi)操作

4.1 定義發(fā)布

Ruby用戶登錄主集群主節(jié)點沙箱,以下操作均在沙箱內(nèi)進(jìn)行。

連接數(shù)據(jù)庫,通過發(fā)布語法指定需要容災(zāi)的主表,語法如下:

--發(fā)布所有表
CREATE PUBLICATION _pub_for_fine_dr FOR ALL TABLES;
--發(fā)布schema
CREATE PUBLICATION _pub_for_fine_dr FOR ALL TABLES IN SCHEMA schema1, schema2;
--發(fā)布表和schema
CREATE PUBLICATION _pub_for_fine_dr FOR ALL TABLES IN SCHEMA schema1, TABLE schema2.table_1;
--增加一個發(fā)布表
ALTER PUBLICATION _pub_for_fine_dr ADD TABLE schema1.table_1;
--增加發(fā)布SCHEMA
ALTER PUBLICATION _pub_for_fine_dr ADD ALL TABLES IN SCHEMA schema2;

定義發(fā)布后,將容災(zāi)publication放到參數(shù)文件中,以dbname.pubname形式,例如:

echo 'dbname._pub_for_fine_dr' > /DWS/data2/finedisaster/pub.list

若需要解除發(fā)布,通過DisasterFineGrained.py腳本下發(fā)cancel-publication命令

# 1、創(chuàng)建需要取消的容災(zāi)對象列表文件
# 解除發(fā)布表
echo 'db_name.schema_name.table_name' > /DWS/data2/finedisaster/config/disaster_object_list.txt
# 解除發(fā)布SCHEMA
echo 'db_name.schema_name' > /DWS/data2/finedisaster/config/disaster_object_list.txt


# 2、下發(fā)cancel-publication命令
python3 $GPHOME/script/DisasterFineGrained.py -t cancel-publication --disaster-object-list-file /DWS/data2/finedisaster/config/disaster_object_list.txt --config-file /DWS/data2/finedisaster/backupRestore.ini


# 3、取消全部發(fā)布
python3 $GPHOME/script/DisasterFineGrained.py -t cancel-publication --config-file /DWS/data2/finedisaster/backupRestore.ini --all-cancel

4.2 啟動容災(zāi)

注意:

云上集群沙箱內(nèi)無法啟動crontab任務(wù),需要在主備集群沙箱外手動添加定時備份恢復(fù)任務(wù)

HCS 8.3.0及以上環(huán)境,沙箱外crontab設(shè)置ssh到沙箱內(nèi)的定時任務(wù),為了防止沙箱逃逸,ssh前需要加上"sudo python3 /rds/datastore/dws/XXXXXX/sudo_lib/checkBashrcFile.py && source /etc/profile && source ~/.bashrc && ",否則定時任務(wù)不生效。checkBashrcFile.py文件路徑與版本號有關(guān)。

主集群主節(jié)點沙箱外設(shè)置定時任務(wù),crontab -e。注意替換主節(jié)點IP。

*/1 * * * * nohup ssh XXX.XXX.XXX.XXX "source /etc/profile;if [ -f ~/.profile ];then source ~/.profile;fi;source ~/.bashrc;nohup python3 /opt/dws/tools/script/SyncDataToStby.py -t backup  --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained --publication-list /DWS/data2/finedisaster/pub.list  >>/dev/null 2>&1 &"  >>/dev/null 2>&1 &
備集群主節(jié)點沙箱外設(shè)置定時任務(wù),crontab -e。注意替換主節(jié)點IP。
*/1 * * * * nohup ssh XXX.XXX.XXX.XXX "source /etc/profile;if [ -f ~/.profile ];then source ~/.profile;fi;source ~/.bashrc;nohup python3 /opt/dws/tools/script/SyncDataToStby.py -t restore  --config-file /DWS/data2/finedisaster/backupRestore.ini  --disaster-fine-grained  >>/dev/null 2>&1 &" >>/dev/null 2>&1 &
成功啟動備份確認(rèn)。

Ruby用戶分別登錄主備集群主節(jié)點沙箱,查詢SyncDataToStby.py進(jìn)程是否存在。

ps ux | grep SyncDataToStby | grep -v grep
Ruby用戶登錄主/備集群主節(jié)點沙箱,使用roach的show-progress監(jiān)控工具,查看備份/恢復(fù)進(jìn)度。show-progress命令提供主備集群備份恢復(fù)進(jìn)度等信息, 顯示結(jié)果為json格式,各字段含義請參考產(chǎn)品文檔。
python3 $GPHOME/script/SyncDataToStby.py -t show-progress --config-file /DWS/data2/finedisaster/backupRestore.ini
系統(tǒng)回顯:


{
  "primary cluster": {
    "key": "20231109_212030",
    "priorKey": "20231109_211754",
    "actionType": "Backup",
    "progress": "100.00%",
    "backupRate": {
      "producerRate": "0MB/s",
      "compressRate": "0MB/s",
      "consumerRate": "0MB/s"
    },
    "currentStep": "FINISH",
    "unrestoreKeys": "N/A",
    "failedStep": "INIT",
    "errorMsg": "",
    "errorCode": "",
    "actionStartTime": "2023-11-09 2128",
    "actionEndTime": "2023-11-09 2149",
    "updateTime": "2023-11-09 2150"
  },
  "standby cluster": {
    "key": "20231109_175002",
    "priorKey": "N/A",
    "actionType": "Restore",
    "progress": "100.00%",
    "backupRate": {
      "producerRate": "0MB/s",
      "compressRate": "0MB/s",
      "consumerRate": "0MB/s"
    },
    "currentStep": "FINISH",
    "unrestoreKeys": "20231109_211754,20231109_212030",
    "failedStep": "INIT",
    "errorMsg": "",
    "errorCode": "",
    "actionStartTime": "2023-11-09 1707",
    "actionEndTime": "2023-11-09 1715",
    "updateTime": "2023-11-09 1715"
  },
  "apply": {
    "backupState": "waiting",
    "restoreState": "waiting",
    "backupSuccessTime": "2023-11-09 2124",
    "restoreSuccessTime": "2023-11-09 1755"
  },
  "latestBarrierTime": "",
  "recovery point objective": "317",
  "failover recovery point time": ""
}

show-progress命令顯示的主要字段釋義如下

priorKey:該備份集是基于這個backup key生成的。

actionType:備份集當(dāng)前的操作類型。
取值包括如下:

Backup,表示備份階段。

Restore,表示恢復(fù)階段。

progress:備份或恢復(fù)操作的進(jìn)度。

currentStep:備份或恢復(fù)正在執(zhí)行的步驟。

unrestoreKeys:待恢復(fù)的key列表。

failedStep:備份或恢復(fù)失敗的步驟,初始值默認(rèn)為INIT。

errorMsg:備份或恢復(fù)失敗的錯誤信息,如果成功,該字段則顯示成功的信息。

errorCode:備份或恢復(fù)的錯誤碼,該字段為預(yù)留字段,暫未使用。

actionStartTime:當(dāng)前操作的開始時間。

actionEndTime:當(dāng)前操作的結(jié)束時間。

updateTime:當(dāng)前操作進(jìn)度的刷新時間。

backupState:當(dāng)前備份狀態(tài)(backuping/stopped/waiting/abnormal)。

restoreState:當(dāng)前恢復(fù)狀態(tài)(restoring/stopped/waiting/abnormal)。

backupSuccessTime:上次成功備份結(jié)束的時間。

restoreSuccessTime:上次成功恢復(fù)結(jié)束的時間。

latestBarrierTime:上次主備集群一致點時間。

recovery point objective:rpo時間(當(dāng)前主集群時間到最后一個恢復(fù)成功的備份集備份開始時間)。

failover recovery point time:failover未同步時間點。

4.3 結(jié)果驗證

4.3.1 功能驗證

同步前后進(jìn)行數(shù)據(jù)一致性校驗,主表、備表數(shù)據(jù)進(jìn)行checksum校驗,檢查是否同步正確(需排除由于接入業(yè)務(wù)導(dǎo)致的差異)。

4.3.2 性能驗證

通過show-progress監(jiān)控工具可以看到最近一次備份、恢復(fù)耗時。

5. 解除容災(zāi)

5.1 停止容災(zāi)

# 主備集群取消沙箱外的定時容災(zāi)任務(wù),在備份/恢復(fù)任務(wù)前添加注釋符“#”,取消定時任務(wù)
crontab -e
# 主集群Ruby用戶登錄主節(jié)點沙箱,停止備份
python3 $GPHOME/script/SyncDataToStby.py -t stop-backup --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained
# 備集群Ruby用戶登錄主節(jié)點沙箱,停止恢復(fù)
python3 $GPHOME/script/SyncDataToStby.py -t stop-restore --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained

5.2 刪除容災(zāi)

警告

當(dāng)不再需要容災(zāi)任務(wù)的時候,可以解除主備關(guān)系,恢復(fù)備集群的讀寫能力。刪除容災(zāi)前需要先停止容災(zāi)。

Ruby用戶登錄主集群主節(jié)點的沙箱內(nèi)。

python3 $GPHOME/script/SyncDataToStby.py -t set-independent --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained
系統(tǒng)回顯:

Delete csv file.
Delete roachbackup file from XXX.XXX.XXX.XX
Delete roachbackup file from XXX.XXX.XXX.XX
Clear cluster disaster state.

6. 總結(jié)

本文介紹了在云上環(huán)境的雙集群(不跨Region不跨VPC)后臺手動部署并使用細(xì)粒度容災(zāi)的主要步驟,分為容災(zāi)前準(zhǔn)備、細(xì)粒度容災(zāi)操作和解除容災(zāi),使得用戶能快速方便得搭建起細(xì)粒度容災(zāi)。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:詳解如何在數(shù)倉中搭建細(xì)粒度容災(zāi)應(yīng)用

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    細(xì)粒度圖像分析技術(shù)詳解

    有別于我們熟悉的圖像識別,細(xì)粒度圖像分析所屬類別和粒度更為精細(xì),本文將向讀者全面介紹這一領(lǐng)域的相關(guān)技術(shù)。 有別于通用圖像分析任務(wù),細(xì)粒度圖像分析的所屬類別和粒度更為精細(xì),它不僅能在更細(xì)
    發(fā)表于 09-30 11:27 ?0次下載
    <b class='flag-5'>細(xì)粒度</b>圖像分析技術(shù)詳解

    一種細(xì)粒度的面向產(chǎn)品屬性的用戶情感模型

    傳統(tǒng)情感模型在分析商品評論的用戶情感時面臨兩個主要問題:1)缺乏針對產(chǎn)品屬性的細(xì)粒度情感分析;2)自動提取的產(chǎn)品屬性其數(shù)量須提前確定。針對上述問題,提出了一種細(xì)粒度的面向產(chǎn)品屬性的用
    發(fā)表于 12-26 10:29 ?0次下載

    基于Modbus功能碼細(xì)粒度過濾算法的研究

    針對防火墻粗粒度過濾Modbus/TCP導(dǎo)致工控系統(tǒng)存在安全威脅的問題,研究基于Modbus功能碼的細(xì)粒度過濾算法。基于Modbus TCP功能碼的特征,對其功能碼字段進(jìn)行解析,實現(xiàn)基于白名單規(guī)則
    發(fā)表于 01-16 15:32 ?0次下載
    基于Modbus功能碼<b class='flag-5'>細(xì)粒度</b>過濾算法的研究

    基于ABS細(xì)粒度隱私隔絕的身份追溯研究

    面臨互聯(lián)網(wǎng)服務(wù)器端證書存儲和身份認(rèn)證任務(wù)成爆炸增加的嚴(yán)峻形勢,細(xì)粒度隱私隔絕能身份追溯工作急需適用的方法。本文基于多屬性基簽名技術(shù),將身份驗證與管理建立在多屬性認(rèn)證的基礎(chǔ)之上,排除身份唯一性標(biāo)識符
    發(fā)表于 02-24 15:50 ?0次下載
    基于ABS<b class='flag-5'>細(xì)粒度</b>隱私隔絕的身份追溯研究

    使用深度模型遷移進(jìn)行細(xì)粒度圖像分類的方法說明

    針對細(xì)粒度圖像分類方法存在模型復(fù)雜度較高、難以利用較深模型等問題,提出深度模型遷移( DMT)分類方法。首先,在粗粒度圖像數(shù)據(jù)集上進(jìn)行深度模型預(yù)訓(xùn)練;然后,使用細(xì)粒度圖像數(shù)據(jù)集對預(yù)訓(xùn)
    發(fā)表于 01-18 17:01 ?5次下載
    使用深度模型遷移進(jìn)行<b class='flag-5'>細(xì)粒度</b>圖像分類的方法說明

    FGIA 主要問題和挑戰(zhàn)

    本文對基于深度學(xué)習(xí)的細(xì)粒度圖像分析進(jìn)行了綜述,從細(xì)粒度圖像識別、檢索和生成三個方向展開論述。
    的頭像 發(fā)表于 07-23 16:04 ?3327次閱讀

    細(xì)粒度圖像分析任務(wù)在發(fā)展過程面臨著獨特的挑戰(zhàn)

    細(xì)粒度圖像分析所面臨的任務(wù)是分析和處理某個類別目標(biāo)下的一系列子類別的問題,例如狗的類別下包含了各種不同外形、顏色、身材的狗。這一任務(wù)最大的挑戰(zhàn)在于子類間的差異很小,而在同一類別的對象卻因為姿態(tài)、大小或者位置呈現(xiàn)出較大的差別。
    的頭像 發(fā)表于 08-02 14:29 ?4918次閱讀

    紹華為云在細(xì)粒度情感分析方面的實踐

    推薦、產(chǎn)品輔助決策、公司政府的輿情監(jiān)測、服務(wù)評價等等。本文主要介紹情感分析的概念、應(yīng)用、任務(wù)和方法,進(jìn)一步會介紹華為云在細(xì)粒度情感分析方面的實踐,包括屬性級情感分析和觀點四元組分析。 主要內(nèi)容包括: 文本情
    的頭像 發(fā)表于 03-08 10:40 ?1906次閱讀

    結(jié)合非局部和多區(qū)域注意力機(jī)制的細(xì)粒度識別方法

    細(xì)粒度圖像識別的目標(biāo)是對細(xì)粒度級別的物體子類進(jìn)行分類,由于不同子類間的差異非常細(xì)微,使得細(xì)粒度圖像識別具有非常大的挑戰(zhàn)性。目前細(xì)粒度圖像識別算法的難度在于如何定位
    發(fā)表于 04-20 11:25 ?3次下載
    結(jié)合非局部和多區(qū)域注意力機(jī)制的<b class='flag-5'>細(xì)粒度</b>識別方法

    基于文本的細(xì)粒度美妝圖譜視覺推理問題

    文中研究了化妝領(lǐng)域中基于文本的細(xì)粒度視覺推理問題,具體探究了一個新穎的多模態(tài)任務(wù),即根據(jù)有序的化妝步驟描述,對化妝過程打亂順序的人臉圖片進(jìn)行排序。針對這個新穎的任務(wù),通過數(shù)據(jù)的處理和分析,提岀了
    發(fā)表于 04-23 14:15 ?1次下載
    基于文本的<b class='flag-5'>細(xì)粒度</b>美妝圖譜視覺推理問題

    基于BiLSTM-CRF的細(xì)粒度知識圖譜問答模型

    基于知識圖譜的問答問句侯選主實體篩選步驟繁瑣,且現(xiàn)有多數(shù)模型忽略了問句與關(guān)系的細(xì)粒度相關(guān)性。針對該問題,構(gòu)建基于 BILSTM-CRF的細(xì)粒度知識圖譜問答模型,其中包括實體識別和關(guān)系
    發(fā)表于 06-03 11:25 ?4次下載

    機(jī)器翻譯細(xì)粒度領(lǐng)域自適應(yīng)的數(shù)據(jù)集和基準(zhǔn)實驗

    細(xì)粒度領(lǐng)域自適應(yīng)問題是一個重要的實際應(yīng)用問題。當(dāng)研發(fā)人員需要為某個特定主題提供翻譯服務(wù)(比如為某個主題的會議提供翻譯)時,往往需要在特定的細(xì)粒度領(lǐng)域上取得更好的翻譯性能。
    的頭像 發(fā)表于 04-26 10:08 ?1324次閱讀

    通過對比學(xué)習(xí)的角度來解決細(xì)粒度分類的特征質(zhì)量問題

    細(xì)粒度分類任務(wù)與常規(guī)的分類問題不同,它希望分類器能夠看到不同類別之間的細(xì)微差異。當(dāng)前流行的細(xì)粒度方法通常從兩個方面設(shè)計以洞察到更加細(xì)微的特征:“更有區(qū)分度的表征學(xué)習(xí)”與“定位特征顯著的部分”。然而,學(xué)習(xí)更有區(qū)分度的圖像表征本身
    的頭像 發(fā)表于 05-13 16:54 ?2387次閱讀
    通過對比學(xué)習(xí)的角度來解決<b class='flag-5'>細(xì)粒度</b>分類的特征質(zhì)量問題

    Leptos利用細(xì)粒度的響應(yīng)式來構(gòu)建聲明性用戶界面

    Leptos 是一個全棧、同構(gòu)的 Rust Web 框架,利用細(xì)粒度的響應(yīng)式來構(gòu)建聲明性用戶界面。
    的頭像 發(fā)表于 10-17 09:58 ?1162次閱讀

    細(xì)粒度圖像識別深度學(xué)習(xí)開源工具庫Hawkeye解析

      Hawkeye 是一個基于 PyTorch 的細(xì)粒度圖像識別深度學(xué)習(xí)工具庫,專為相關(guān)領(lǐng)域研究人員和工程師設(shè)計。目前,Hawkeye 包含多種代表性范式的細(xì)粒度識別方法,包括 “基于深度濾波器”、“基于注意力機(jī)制”、“基于高階特征交互”、“基于特殊損失函數(shù)”、“基于網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-06 20:26 ?1108次閱讀