0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究Git基本原理(上)

jf_78858299 ? 來源:分布式實驗室 ? 作者:分布式實驗室 ? 2023-05-12 15:20 ? 次閱讀

簡單地說,Git 究竟是怎樣的一個系統(tǒng)呢?請注意接下來的內(nèi)容非常重要,若你理解了 Git 的思想和基本工作原理,用起來就會知其所以然,游刃有余。

在學(xué)習(xí) Git 時,請盡量理清你對其它版本管理系統(tǒng)已有的認識,如 CVS、Subversion 或 Perforce, 這樣能幫助你使用工具時避免發(fā)生混淆。

盡管 Git 用起來與其它的版本控制系統(tǒng)非常相似, 但它在對信息的存儲和認知方式上卻有很大差異,理解這些差異將有助于避免使用中的困惑。

圖片

Git 初始化代碼倉庫

執(zhí)行完成了 git init 命令,究竟做了什么呢?

執(zhí)行完成如下命令之后,我們可以得到下圖所示的內(nèi)容,右側(cè)的就是 Git 為我們創(chuàng)建的代碼倉庫,其中包含了用于版本管理所需要的內(nèi)容。

# 左邊執(zhí)行
$ mkdir git-demo
$ cd git-demo && git init
$ rm -rf .git/hooks/*.sample

# 右邊執(zhí)行
$ watch -n 1 -d find .

圖片

我們這里可以一起看下生成的 .git 目錄的結(jié)構(gòu)如何:

? tree .git
.git
├── HEAD
├── config
├── description
├── hooks
├── info
│ └── exclude
├── objects
│ ├── info
│ └── pack
└── refs
├── heads
└── tags

.git/config - 當(dāng)前代碼倉庫本地的配置文件

  • 本地配置文件(.git/config)和全局配置文件(~/.gitconfig)
  • 通過執(zhí)行如下命令,可以將用戶配置記錄到本地代碼倉庫的配置文件中去
  • git config user.name "demo"
  • git config user.email "demo@demo.com"
? cat .git/config
[core]
repositoryformatversion = 0
filemode = true
bare = false
logallrefupdates = true
ignorecase = true
precomposeunicode = true

[user]
name = demo
email = demo@demo.com

.git/objects - 當(dāng)前代碼倉庫代碼的存儲位置

  • blob 類型
  • commit 類型
  • tree 類型

# 均無內(nèi)容
? ll .git/objects
total 0
drwxr-xr-x 2 escape staff 64B Nov 23 20:39 info
drwxr-xr-x 2 escape staff 64B Nov 23 20:39 pack

? ll .git/objects/info
? ll .git/objects/pack

.git/info - 當(dāng)前倉庫的排除等信息

? cat ./.git/info/exclude
# git ls-files --others --exclude-from=.git/info/exclude
# Lines that start with '#' are comments.
# For a project mostly in C, the following would be a good set of
# exclude patterns (uncomment them if you want to use them):
# *.[oa]
# *~

.git/hooks - 當(dāng)前代碼倉庫默認鉤子腳本

./.git/hooks/commit-msg.sample
./.git/hooks/pre-rebase.sample
./.git/hooks/pre-commit.sample
./.git/hooks/applypatch-msg.sample
./.git/hooks/fsmonitor-watchman.sample
./.git/hooks/pre-receive.sample
./.git/hooks/prepare-commit-msg.sample
./.git/hooks/post-update.sample
./.git/hooks/pre-merge-commit.sample
./.git/hooks/pre-applypatch.sample
./.git/hooks/pre-push.sample
./.git/hooks/update.sample

.git/HEAD - 當(dāng)前代碼倉庫的分支指針

? cat .git/HEAD
ref: refs/heads/master

.git/refs - 當(dāng)前代碼倉庫的頭指針

# 均無內(nèi)容
? ll .git/refs
total 0
drwxr-xr-x 2 escape staff 64B Nov 23 20:39 heads
drwxr-xr-x 2 escape staff 64B Nov 23 20:39 tags

? ll .git/refs/heads
? ll .git/refs/tags

.git/description - 當(dāng)前代碼倉庫的描述信息

? cat .git/description
Unnamed repository; edit this file 'description' to name the repository.

add 之后發(fā)生了什么

執(zhí)行完成了 git add 命令,究竟做了什么呢?

執(zhí)行完成如下命令之后,我們可以得到下圖所示的內(nèi)容,我們發(fā)現(xiàn)右側(cè)新增了一個文件,但是 Git 目錄里面的內(nèi)容絲毫沒有變化。這是因為,我們現(xiàn)在執(zhí)行的修改默認是放在工作區(qū)的,而工作區(qū)里面的修改不歸 Git 目錄去管理。

而當(dāng)我們執(zhí)行 git status 命令的時候,Git 又可以識別出來現(xiàn)在工作區(qū)新增了一個文件,這里怎么做到的呢?—— 詳見[理解 blob 對象和 SHA1]部分

而當(dāng)我們執(zhí)行 git add 命令讓 Git 幫助我們管理文件的時候,發(fā)現(xiàn)右側(cè)新增了一個目錄和兩個文件,分別是 8d 目錄、index 和 0e41.. 文件。

# 左邊執(zhí)行
$ echo "hello git" > helle.txt
$ git status
$ git add hello.txt

# 右邊執(zhí)行
$ watch -n 1 -d find .

圖片

圖片

我們這里重點看下,生成的 8d 這個目錄以及下面的文件。而其名稱的由來是因為 Git 對其進行了一個叫做 SHA1 的 Hash 算法,用于將文件內(nèi)容或者字符串變成這么一串加密的字符。

# 查看 objects 的文件類型
$ git cat-file -t 8d0e41
blob

# 查看 objects 的文件內(nèi)容
$ git cat-file -p 8d0e41
hello git

# 查看 objects 的文件大小
$ git cat-file -s 8d0e41
10

# 拼裝起來
blob 10\\0hello git

現(xiàn)在我們就知道了,執(zhí)行 git add 命令將文件從工作區(qū)添加到暫存區(qū)里面,Git 會把幫助我們生成一些 Git 的對象,它存儲的是文件的內(nèi)容和文件類型并不存儲文件名稱。

微信搜索公眾號:架構(gòu)師指南,回復(fù):架構(gòu)師 領(lǐng)取資料

為了驗證我們上述的說法,我們可以添加同樣的內(nèi)容到另一個文件,然后進行提交,來觀察 .git 目錄的變化。我們發(fā)現(xiàn),右側(cè)的 objects 目錄并沒有新增目錄和文件。這就可以證明,blob 類型的 object 只存儲的是文件的內(nèi)容,如果兩個文件的內(nèi)容一致的話,則只需要存儲一個 object 即可。

話說這里 object 為什么沒有存儲文件名稱呢?這里因為 SHA1 的 Hash 算法計算哈希的時候,本身就不包括文件名稱,所以取什么名稱都是無所謂的。那問題來了,就是文件名的信息都存儲到哪里去了呢?—— 詳見[理解 blob 對象和 SHA1]部分

# 左邊執(zhí)行
$ echo "hello git" > tmp.txt
$ git add tmp.txt

# 右邊執(zhí)行
$ watch -n 1 -d find .

圖片

理解 blob 對象和 SHA1

了解 Git 的 blob 對象和 SHA1 之前的關(guān)系和對應(yīng)計算!

Hash 算法是把任意長度的輸入通過散列算法變化成固定長度的輸出,根據(jù)算法的不同,生成的長度也有所不同。

Hash 算法:

  • MD5 - 128bit - 不安全 - 文件校驗
  • SHA1 - 160bit(40位) - 不安全 - Git 存儲
  • SHA256 - 256bit- 安全 - Docker 鏡像
  • SHA512 - 512bit - 安全

但是,當(dāng)我們使用工具對上述文件內(nèi)容進行 SHA1 計算的時候,會發(fā)現(xiàn)并沒有我們在 .git 目錄里面看到的那樣,這是為什么呢?

? echo "hello git" | shasum
d6a96ae3b442218a91512b9e1c57b9578b487a0b -

這里因為 Git 工具的計算方式,是使用類型 長度 \\0 內(nèi)容的方式進行計算的。這里,我們算了下文件內(nèi)容只有九位,但是這里是十位,這里因為內(nèi)容里面有換行符的存在導(dǎo)致的?,F(xiàn)在我們就可以使用 git cat-file 命令來拼裝 Git 工具存儲的完整內(nèi)容了。

? ls -lh hello.txt
-rw-r--r-- 1 escape staff 10B Nov 23 21:12 hello.txt

? echo "blob 10\\0hello git" | shasum
8d0e41234f24b6da002d962a26c2495ea16a425f -

# 拼裝起來
blob 10\\0hello git

圖片

當(dāng)我們使用 cat 命令來查看 object 對象里面的內(nèi)容的時候,發(fā)現(xiàn)看著像是一串亂碼。其實這是 Git 工具將文件的原始內(nèi)容進行一個壓縮,然后再存儲到 object 對象里面。奇怪的是,我們發(fā)現(xiàn)壓縮之后的內(nèi)容反而比原始內(nèi)容還大!

這是因為其進行了壓縮,存儲了一些壓縮相關(guān)的信息。上例所示的比原始文件大,是因為我們創(chuàng)建的內(nèi)容實在是太小了。當(dāng)我們常見一個比較大的文件時,就會看到壓縮之后的文件大小遠小于原始文件的。

? cat .git/objects/8d/0e41234f24b6da002d962a26c2495ea16a425f
xKOR04`HWH,6A%

? ls -lh .git/objects/8d/0e41234f24b6da002d962a26c2495ea16a425f
-r--r--r-- 1 escape staff 26B Nov 23 21:36 .git/objects/8d/0e41234f24b6da002d962a26c2495ea16a425f

? file .git/objects/8d/0e41234f24b6da002d962a26c2495ea16a425f
.git/objects/8d/0e41234f24b6da002d962a26c2495ea16a425f: VAX COFF executable not stripped - version 16694

其實,我們這里也是可以通過 Python 代碼來獲取二進制 object 對象的內(nèi)容的。

import zlib

contents = open('0e41234f24b6da002d962a26c2495ea16a425f', 'rb').read()
zlib.decompress(contents)

圖片

聊聊工作區(qū)和暫存區(qū)

聊聊工作區(qū)和暫存區(qū),以及文件如何在工作區(qū)和緩存區(qū)之間同步的問題。

之前的章節(jié)我們也聊到了,當(dāng)我們執(zhí)行 git status 命令的時候,Git 工具怎么知道我們有一個文件沒有追蹤,以及文件名的信息都存儲到哪里去了?

這一切的答案,都要從工作區(qū)和索引區(qū)講起。Git 根據(jù)其存儲的狀態(tài)不同,將對應(yīng)狀態(tài)的“空間”分為工作區(qū)、暫存區(qū)(也可稱為索引區(qū))和版本區(qū)三類。具體示例,可以參考下圖。

圖片

而更加深層次的理解,就要從執(zhí)行 git add 命令后生成相關(guān)的 object 對象,但是其存儲的是文件的類容、大小和內(nèi)容,并不包含文件名稱的信息。而文件名稱相關(guān)的信息就包含在生成的 index 文件(索引文件)里面。

當(dāng)我們直接查看 index 文件里面的內(nèi)容,發(fā)現(xiàn)使我們無法理解的亂碼,但是通過基本的輸出,我們可以看到其文件名稱。要想查看 index 文件的內(nèi)容,可以通過 Git 提供的相關(guān)命令進行查看。

# 左邊執(zhí)行
$ echo "file1" > file1.txt
$ git add file1.txt
$ cat .git/index

$ git ls-files # 列出當(dāng)前暫存區(qū)的文件列表信息
$ git ls-files -s # 列出當(dāng)前暫存區(qū)文件的詳細信息

# 右邊執(zhí)行
$ watch -n 1 -d tree .git

圖片

當(dāng)添加文件的時候,文件或目錄會從工作區(qū)流向暫存區(qū),加之一些其他操作,會導(dǎo)致工作區(qū)和暫存區(qū)是會有一定差別的。這就會導(dǎo)致,當(dāng)我們執(zhí)行 git status 的結(jié)果就是兩者的差別。

經(jīng)過如下操作,會使工作區(qū)和暫存區(qū)和的內(nèi)容不一致了,通過命令我們也是可以查看區(qū)別的。當(dāng)我們使用 add 命令將新文件添加到暫存區(qū)的時候,會發(fā)現(xiàn)這下就一致了。

# 左邊執(zhí)行
$ git status
$ echo "file2" > file2.txt
$ git ls-files -s
$ git status
$ git add file2.txt
$ git ls-files -s
$ git status

# 右邊執(zhí)行
$ watch -n 1 -d tree .git

圖片

如果我們這里去修改一個文件的話,很顯然這個時候我們的工作區(qū)和暫存區(qū)又不一致了。當(dāng)我們使用命令去查看文件狀態(tài)的時候,發(fā)現(xiàn)一個文件被修改了,而 Git 是怎么知道的呢?咳咳,就是通過查找 index 文件的內(nèi)容,找到對應(yīng)文件名稱以及其內(nèi)部引用的 object 對象,與工作區(qū)的文件內(nèi)容進行對比而來的。

# 左邊執(zhí)行
$ git ls-files -s
$ echo "file.txt" > file1.txt
$ git status

# 右邊執(zhí)行
$ watch -n 1 -d tree .git

圖片

而這個時候,我們再使用 git add 命令將其修改內(nèi)容保存至?xí)捍鎱^(qū)的話,會發(fā)現(xiàn)對應(yīng)文件的 object 的 blob 對象的引用值發(fā)生改變了。這時可以發(fā)現(xiàn),objects 目錄下面有三個對象了,其中 file1.txt 占了兩個,但是文件卻只有兩個。通過命令查看對應(yīng) blob 對象的內(nèi)容,發(fā)現(xiàn)各有不同。

# 左邊執(zhí)行
$ git ls-files -s
$ git add file1.txt
$ git ls-files -s

# 右邊執(zhí)行
$ watch -n 1 -d tree .git

圖片

理解 commit 提交原理

執(zhí)行完成了 git commit 命令,究竟做了什么呢?

Git 倉庫中的提交記錄保存的是你的目錄下所有文件的快照,就像是把整個目錄復(fù)制,然后再粘貼一樣,但比復(fù)制粘貼優(yōu)雅許多!Git 希望提交記錄盡可能地輕量,因此在你每次進行提交時,它并不會盲目地復(fù)制整個目錄。條件允許的情況下,它會將當(dāng)前版本與倉庫中的上一個版本進行對比,并把所有的差異打包到一起作為一個提交記錄。Git 還保存了提交的歷史記錄。這也是為什么大多數(shù)提交記錄的上面都有父節(jié)點的原因。

當(dāng)我們使用 add 命令將工作區(qū)提交到暫存區(qū),而暫存區(qū)其實保存的是當(dāng)前文件的一個狀態(tài),其中包括有哪些目錄和文件,以及其對應(yīng)的大小和內(nèi)容等信息。但是我們最終是需要將其提交到代碼倉庫(本地)的,而其命令就是 git commit 了。

圖片

而當(dāng)我們執(zhí)行 git commit 命令的時候,究竟都發(fā)生了什么呢?可以看到當(dāng)提交之后,.git 目錄中生成了兩個信息的 object 對象,其中 logs 和 refs 目錄都有新的文件生成。通過如下操作,我們可以查看到其提交的類型和對應(yīng)內(nèi)容。

# 左邊執(zhí)行
$ git commit -m "1st commit"

$ git cat-file -t 6e4a700 # 查看 commit 對象的類型
$ git cat-file -p 6e4a700 # 查看 commit 對象的內(nèi)容

$ git cat-file -t 64d6ef5 # 查看 tree 對象的類型
$ git cat-file -p 64d6ef5 # 查看 tree 對象的內(nèi)容

# 右邊執(zhí)行
$ watch -n 1 -d tree .git

圖片

這樣我們就理解了,當(dāng)我們執(zhí)行 git commit 命令之后,會生成一個 commit 對象和一個 tree 對象。commit 對象內(nèi)容里面包含了一個 tree 對象和相關(guān)提交信息,而 tree 對象里面則包含了這次我們提交版本里面的文件狀態(tài)(文件名稱和 blob 對象),這樣我們就知道了這次提交的變動了。

圖片

我們這次提交之后,處理 objects 目錄發(fā)生變動之外,還有一些其他的變化。比如 logs 和 refs 的目錄有所變化。我們查看 refs 目錄里面的內(nèi)容,發(fā)現(xiàn)其指向了 6e4a70 這個 commit 對象,即當(dāng)前 master 分支上面最新的提交就是這個 6e4a70 了。

而這個 6e4a70 這個 commit 對象,有一個 HEAD 的指向,就是 .git 目錄下的 HEAD 文件。其實質(zhì)就是一個指針,其永遠指向我們當(dāng)前工作的分支,即這里我們工作在 master 分支上。當(dāng)我們切換分支的時候,這個文件的指向也會隨機改變的。

# 左邊執(zhí)行
$ cat .git/refs/heads/master
$ cat .git/HEAD

# 右邊執(zhí)行
$ watch -n 1 -d tree .git

圖片

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • CVS
    CVS
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    10989
  • Git
    Git
    +關(guān)注

    關(guān)注

    0

    文章

    199

    瀏覽量

    15765
  • 版本管理
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    165
收藏 人收藏

    評論

    相關(guān)推薦

    步進電機基本原理

    本帖最后由 eehome 于 2013-1-5 09:48 編輯 步進電機基本原理
    發(fā)表于 08-16 16:17

    串聯(lián)諧振逆變器的基本原理

    串聯(lián)諧振通常伴有逆變器。該組合稱為串聯(lián)諧振逆變器。什么是基本原理?讓我簡要介紹串聯(lián)諧振逆變器的一些基本原理。]首先給你看一張圖片:
    發(fā)表于 11-07 10:21

    IC測試基本原理是什么?

    IC測試基本原理是什么?ATE測試向量是什么?
    發(fā)表于 05-07 06:43

    IC測試的基本原理是什么?

    本文詳細介紹了芯片開發(fā)和生產(chǎn)過程中的IC測試基本原理。
    發(fā)表于 05-08 07:33

    電機轉(zhuǎn)動的基本原理是什么?

    電機轉(zhuǎn)動的基本原理是什么?電機運動的基本原則有哪些?
    發(fā)表于 07-21 07:59

    線性電源的基本原理是什么

    多路線性電源 AC-DC穩(wěn)壓電源 低紋波電源 可調(diào)線性電源 原理圖PCB目錄多路線性電源 AC-DC穩(wěn)壓電源 低紋波電源 可調(diào)線性電源 原理圖PCB基本原理芯片選型原理圖&3D-PCB具體
    發(fā)表于 07-30 07:47

    SPWM的基本原理

    基本原理SPWM的全稱是(Sinusoidal PWM),正弦脈沖寬度調(diào)制是一種非常成熟,使用非常廣泛的技術(shù);之前在PWM的文章中介紹過,基本原理就是面積等效原理,即沖量相等而形狀不同的窄脈沖加在
    發(fā)表于 09-06 08:13

    無線充電的基本原理是什么

    一 、無線充電基本原理無線充電的基本原理就是我們平時常用的開關(guān)電源原理,區(qū)別在于沒有磁介質(zhì)耦合,那么我們需要利用磁共振的方式提高耦合效率,具體方法是在發(fā)送端和接收端線圈串并聯(lián)電容,是發(fā)送線圈處理諧振
    發(fā)表于 09-15 06:01

    RAID技術(shù)的基本原理是什么

    RAID技術(shù)的基本原理是什么?RAID技術(shù)有哪幾個優(yōu)勢?
    發(fā)表于 10-14 12:01

    IIC的基本原理是什么?

    IIC的基本原理是什么?
    發(fā)表于 11-25 08:46

    串口通信的基本原理是什么?

    同步通信和異步通信的區(qū)別是什么?串口通信的基本原理是什么?
    發(fā)表于 12-13 06:46

    步進馬達基本原理

    步進馬達基本原理步進馬達基本原理步進馬達基本原理
    發(fā)表于 11-30 11:55 ?8次下載

    探究Git基本原理(下)

    簡單地說,Git 究竟是怎樣的一個系統(tǒng)呢?請注意接下來的內(nèi)容非常重要,若你理解了 Git 的思想和基本工作原理,用起來就會知其所以然,游刃有余。 在學(xué)習(xí) Git 時,請盡量理清你對其它版本管理
    的頭像 發(fā)表于 05-12 15:20 ?606次閱讀
    <b class='flag-5'>探究</b><b class='flag-5'>Git</b><b class='flag-5'>基本原理</b>(下)

    6.4.2.1 基本原理∈《碳化硅技術(shù)基本原理——生長、表征、器件和應(yīng)用》

    6.4.2.1基本原理6.4.2n型和p型SiC的歐姆接觸6.4金屬化第6章碳化硅器件工藝《碳化硅技術(shù)基本原理——生長、表征、器件和應(yīng)用》往期內(nèi)容:6.4.1.2SiC的肖特基接觸∈《碳化硅技術(shù)
    的頭像 發(fā)表于 01-24 10:09 ?1672次閱讀
    6.4.2.1 <b class='flag-5'>基本原理</b>∈《碳化硅技術(shù)<b class='flag-5'>基本原理</b>——生長、表征、器件和應(yīng)用》

    密碼學(xué)基本原理()

    電子發(fā)燒友網(wǎng)站提供《密碼學(xué)基本原理().pdf》資料免費下載
    發(fā)表于 08-02 09:13 ?1次下載
    密碼學(xué)<b class='flag-5'>基本原理</b>(<b class='flag-5'>上</b>)