Fork me on GitHub

一文读懂Git

版本控制

版本控制就是记录项目文件的历史变化。它为我们查阅日志回退协作等方面提供了有力的帮助。

版本控制一般分为集中化版本控制和分布式版本控制。

集中化的版本控制系统

git_002

集中化主要的版本数据都保存服务端。

分布式版本数据分散在多端。

Git

Git属于分布式版本控制,也是现在比较流行的一种版本管理工具。

Git项目有三个区块:工作区 / 暂存区 / 版本库

  • 工作区存放从版本库提取出来的文件,供我们编辑修改;
  • 暂存区保存了下一次要提交的目录信息;
  • 版本库保存项目版本元数据和Objects数据,后文会详解。

Git工作流程

Git工作流程

1
2
3
4
5
6
# 下载
<<==== clone
# 上传
====>> add ====>> commit ====>> push
# 更新
<<==== merge|rebase <<===== fetch

区分 Pull vs Fetch

我们将一个更新操作拆分为数据更新+合并处理两部分,这样来看 fetch 只是进行数据更新。而pull 其实是 ( fetch + (merge|rebase) )组合操作,它执行数据更新同时执行合并处理。pull 默认是fetch+merge 组合 ,也可以通过参数 –rebase 指定为 fetch + rebase。

区分Merge vs Rebase

合并处理是Git很重要的一块知识。两个命令在工作中也经常使用,区分它们对我们很有用。

场景如下

项目有一个mywork分支。C2时间点我和小明各自下载项目进行功能开发,小明效率比较高,先推送了C3 C4 到远程仓库。我本地仓库现在有C5 C6两个提交,要推送到远程仓库,需先同步远程仓库版本。

rebase1

如果通过 fetch + merge 方式,Git会将远程最新(C4)和本地最新(C6)进行合并并产生一个新的(C7)。

冲突处理步骤

1
2
3
4
5
6
7
8
9
10
git merge # 发生冲突会出现冲突标记
“<<<<<<< HEAD
40
=======
41
>>>>>>> 41”
# 手动处理冲突
git add .
git commit -m 'fix conflict'
git push origin HEAD

git merge

如果通过 fetch + rebase 方式,git会先将C5 C6存储到.git/rebase零时目录,合并成功后删除。

冲突处理步骤

1
2
3
4
5
6
7
8
9
10
git rebase # 发生冲突会出现冲突标记
“<<<<<<< HEAD
40
=======
41
>>>>>>> 41”
# 手动处理冲突
git add .
git rebase --continue
git push origin HEAD

git rebase

rebase5

小结

git merge 会产生大量Merge日志,可能会对查看带来不便。不过大家还是根据实际情况进行选取。

关于撤销回退几种场景

提交后发现有文件漏了,又不想提交两次。此时通过 “git commit –amend” 可以合并为一个提交。

1
2
3
git commit -m 'initial commit'
git add .gitignore
git commit --amend

如果文件想撤回且尚未提交,执行下面命令撤出暂存空间(index)

1
git reset HEAD <file>...

关于 reset 其它用法

1
2
3
4
5
6
# 重置到指定版本,之前提交内容将丢失
git reset --hard HEAD
# 重置到指定版本,保留更改的文件但未标记为提交
git reset --mixed HEAD
# 重置到指定版本,保留所有改动文件
git reset –soft HEAD

特别注意 当你使用 “git reset –hard HEAD” 重置到某一版本,发现搞错了想回退。这时你可能会执行“git log”,但是发现已经没有以前的版本记录,怎么办?送你一瓶后悔药如下

1
2
3
4
5
6
7
8
9
10
11
12
# reflog 是Git操作的全日志记录
git reflog

6241462 (HEAD -> master) HEAD@{0}: reset: moving to 6241462
ea9b5ab HEAD@{1}: reset: moving to ea9b5ab
6241462 (HEAD -> master) HEAD@{2}: commit: Hello
34cd1e3 HEAD@{3}: commit: 3
ea9b5ab HEAD@{4}: commit: 2
729a8b1 (origin/master) HEAD@{5}: commit (initial): 1

# 找到最左边对应hash值就可以回退到任意位置
git reset --hard {index}

如果想撤回文件修改内容且文件尚未提交,执行下面命令

1
git checkout -- <file>

如果创建的分支名称需要更改

1
2
3
4
5
git branch -m old new

# 如果分支已经推送到远程,先删除再推送新分支
git push origin --delete old
git push origin new

如果需要撤回的提交已经推送到了远程仓库,那么补救的方式只有创建新的提交。

可以利用revert快速撤回到需要回退的版本。

1
2
3
4
5
6
# 还原最近一个提交
git revert HEAD
# 还原倒数第二个
git revert HEAD^
# 还原倒数第第四个
git revert HEAD~3

版本库 Objects

这一节介绍一下Git版本库的存储模型。

项目历史变动信息都记录在object文件。文件名称是通过哈希算法 ( 这里是SHA1(对象内容) ) 产生的40位字符。

这种做法的一个优点就是“在对比两对象是否相同时,只需要比较文件名称就能迅速得出结果”

哈希算法:简单来说就是向函数输入一些内容,输出长度固定的字符串。这里SHA1函数固定输出40长度字符。

object文件分 blob tree commit tag 四种类型

  • blob 存储文件数据,一般是一个文件;

  • tree 存储目录和树的引用(子文件目录);

  • commit 存储单一树引用,时间点,提交作者,上一次提交指针;

  • tag 标记特定的commit 比如说发版。

特别注意:Subversion,CVS,Perforce,Mercurial等是存储前后两次提交的差异数据。Gi-每次提交时,它都会以树状结构存储项目中所有文件的外观快照。

Blob

blob

Blob 是二进制数据块,不会引用其它东西。如果目录树(或存储库中多个不同版本)中的两个文件具有内容相同,它们将共享相同的Blob对象。

Tree

tree

Tree 存储blob和tree的引用。

1
2
3
4
5
6
# 我查询 add1a1306e20...
git ls-tree add1a1306e20...

100644 blob 4661b39c3460a5c1f9e9309e6341962e0499b037 README.md
040000 tree ad46b24a4b0648ede3ca090dde32c89b89f7f2c1 src
...

Commit

commit

Commit 包含下面几个信息

  1. tree 提交时间点的目录;
  2. parent 上一个提交;
  3. author 提交人;
1
2
3
4
5
6
7
git show -s --pretty=raw add1a1306e....

commit add1a1306e....
tree 81d4e4271a56575da7f992dc0dfc72ff7ddff94c
parent cd397e4c373013b19825b857b43ad8f677607f5d
author lixingping <lixingping233@gmail.com> 1589783810 +0800
committer lixingping <lixingping233@gmail.com> 1589783810 +0800

Tag

tag

1
2
3
4
5
6
git cat-file tag v_1.0

object 24d16acd6aa08f74556c7ce551fa571b4bfe4079
type commit
tag v_1.0
tagger lixingping <lixingping233@gmail.com> 1588591122 +0800

例子

假设项目目录结构如下,我们进行一个初始提交。几种文件关系如下图

1
2
3
|-- read.txt
--| lib
--| hello.java

commit_process

附上一些常用命令

生成SSH key

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
ssh-keygen -t rsa -b 4096 -C "email@example.com"
# 指定生成的文件
ssh-keygen -t rsa -b 4096 -C "email@example.com" -f ~/.ssh/id_rsa_example
# id_rsa_example.pub 粘贴远程仓库

# 配置多个远程仓库
touch ~/.ssh/config

#添加一下内容
Host github.com
HostName github.com
User git
IdentityFile ~/.ssh/id_rsa_github

Host example.com
HostName example.com
User git
IdentityFile ~/.ssh/id_rsa_example

配置

1
2
3
4
5
6
git config –global user.name “xxx”
git config –global user.email “xxx@email.com“
git config --global core.autocrlf true # 建议配置 windows mac换行符不统一问题
git config --global core.editor vim # 配置默认编辑器
git config --global core.excludesfile ~/.gitignore_global # 配置全局忽略文件
git config –list # 查看配置信息

分支管理

1
2
3
4
5
6
7
8
9
10
git branch --list # 罗列本地所有分支
git branch --all # 罗列本地和远程所有分支
git branch -r # 罗列远程所有分支
git branch -v # 显示各分支最后提交信息
git checkout <branch name> # 切换分支
git checkout -b <new branch name> # 创建新分支
git push origin <new branch name> # 推送新分支到远程
git checkout -m <old branch> <new branch> # 重命名分支名称
git branch -d <[list]branch name> # 删除本地分支
git push origin --delete <branch name> # 删除远程分支

标签管理

1
2
3
4
5
6
git tag -l # 罗列本地所有标签
git show <tag name> # 显示指定标签
git tag -a v_1.0.0 -m "备注" # 创建标签
git push origin <tag name> # 推送标签到远程
git tag -d <tag name> # 删除本地标签
git push --delete origin <tag name> # 删除远程标签

总结

工作多年以来一直在使用Git,但是对Git没有一个系统了解,所以写这篇文章归整一下。

欢迎大家留言交流,一起学习分享!!!