Bash Shell 逐行读取文件

1. 问题

先看有问题的代码:

#!/bin/bash
cat file.txt | while read eachline ; do
        echo $eachline
done

上例中,while代码块的输入流已经被管道符重定向至cat的输出,

所以如果在while代码块内,有sed、awk、ssh 等命令时,会在第一次循环时,一次性读取输入流内容的所有行。

这样read命令在第二次运行时,输入流的内容已经是空的,read就读取不到内容,从而结束循环。

2. 解决方法

为了避免上面的问题,可以参考这样的处理方式:

假如,/etc/hosts的内容有

192.168.12.6   host_a
192.168.12.9  host_b
192.168.12.18  host_c
192.168.12.19  host_d

用这段代码处理:

cat /etc/hosts | grep host | while read v1 v2
do
exec 8<& 0 0< /dev/null
ssh $v2 "hostname"
exec 0<& 8 8<& -
done

运行以上代码后,输出结果为:

host_a
host_b
host_c
host_d

3. 原理

FD=文件标示符(File Descriptor)

exec 8<& 0 0< /dev/null 这句会将FD=8的输入重定向到FD=0所使用的输入设备,然后将FD=0的输入重定向到/dev/null。

这样,ssh就不会影响到read在下一次要读取的内容。

exec 0<& 8 8<& - 这句会将FD=0的输入重定向到FD=8所使用的输入设备(也就是cat的输出内容),然后关闭FD=8的输入,使其他程序可以使用FD=8。

Ubuntu16.04解决无法切换root权限的问题

在su root时发现无法切换到root权限.显示: /usr/local/bin/zsh 没有文件或目录

想了想问题所在,突然想起来前段时间想要更换shell主题,于是装了zsh和oh-my-zsh,用了一段时间感觉没有bash好用(纯粹个人感觉),于是sudo apt remove zsh了.

当时将默认的shell改成了zsh:

chsh -s /bin/zsh

那么chsh到底修改了哪里呢? chsh -s 其实修改的是你的/etc/passwd文件里和你用户名相对应的一行,我们可以查看一下:

shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$  cat /etc/passwd|grep ^shanlei
shanlei:x:1000:1000:shanlei,,,:/home/shanlei:/bin/zsh
shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$

进入passwd:

sudo vim /etc/passwd

我们可以看到 :

root:x:0:0:root:/root:/usr/local/bin/zsh
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync
games:x:5:60:games:/usr/games:/usr/sbin/nologin
man:x:6:12:man:/var/cache/man:/usr/sbin/nologin
lp:x:7:7:lp:/var/spool/lpd:/usr/sbin/nologin
mail:x:8:8:mail:/var/mail:/usr/sbin/nologin
news:x:9:9:news:/var/spool/news:/usr/sbin/nologin
uucp:x:10:10:uucp:/var/spool/uucp:/usr/sbin/nologin
proxy:x:13:13:proxy:/bin:/usr/sbin/nologin
www-data:x:33:33:www-data:/var/www:/usr/sbin/nologin
backup:x:34:34:backup:/var/backups:/usr/sbin/nologin
list:x:38:38:Mailing List Manager:/var/list:/usr/sbin/nologin
irc:x:39:39:ircd:/var/run/ircd:/usr/sbin/nologin
gnats:x:41:41:Gnats Bug-Reporting System (admin):/var/lib/gnats:/usr/sbin/nologin
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
systemd-timesync:x:100:102:systemd Time Synchronization,,,:/run/systemd:/bin/false
systemd-network:x:101:103:systemd Network Management,,,:/run/systemd/netif:/bin/false
systemd-resolve:x:102:104:systemd Resolver,,,:/run/systemd/resolve:/bin/false
systemd-bus-proxy:x:103:105:systemd Bus Proxy,,,:/run/systemd:/bin/false
syslog:x:104:108::/home/syslog:/bin/false
_apt:x:105:65534::/nonexistent:/bin/false
messagebus:x:106:110::/var/run/dbus:/bin/false
uuidd:x:107:111::/run/uuidd:/bin/false
lightdm:x:108:114:Light Display Manager:/var/lib/lightdm:/bin/false
whoopsie:x:109:116::/nonexistent:/bin/false
avahi-autoipd:x:110:119:Avahi autoip daemon,,,:/var/lib/avahi-autoipd:/bin/false
avahi:x:111:120:Avahi mDNS daemon,,,:/var/run/avahi-daemon:/bin/false
dnsmasq:x:112:65534:dnsmasq,,,:/var/lib/misc:/bin/false
colord:x:113:123:colord colour management daemon,,,:/var/lib/colord:/bin/false
speech-dispatcher:x:114:29:Speech Dispatcher,,,:/var/run/speech-dispatcher:/bin/false
hplip:x:115:7:HPLIP system user,,,:/var/run/hplip:/bin/false
kernoops:x:116:65534:Kernel Oops Tracking Daemon,,,:/:/bin/false
pulse:x:117:124:PulseAudio daemon,,,:/var/run/pulse:/bin/false
rtkit:x:118:126:RealtimeKit,,,:/proc:/bin/false
saned:x:119:127::/var/lib/saned:/bin/false
usbmux:x:120:46:usbmux daemon,,,:/var/lib/usbmux:/bin/false
shanlei:x:1000:1000:shanlei,,,:/home/shanlei:/bin/zsh

因为我想要的是默认的bash,所以我修改了passwd文件的第一行和最后一行:

第一行的/usr/local/bin/bash改成/usr/local/bin/zsh,这个是root用户的:

root:x:0:0:root:/root:/usr/local/bin/bash

把最后一行的/bin/bash改成/bin/zsh,这个应该是每台电脑的登录用户名+计算机名组成的:

shanlei:x:1000:1000:shanlei,,,:/home/shanlei:/bin/bash

保存退出,重启shell,切换root权限,发现/usr/local/bin/bash 没有文件或目录

检查bash安装位置:

shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ whereis bash
bash: /bin/bash /etc/bash.bashrc /usr/share/man/man1/bash.1.gz
shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ 

发现bash的执行文件在/bin/bash,于是重新修改/etc/passwd文件的第一行:

root:x:0:0:root:/root:/bin/bash

然后把默认的shell改为bash:

chsh -s /bin/bash

再次切换:

shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ su -
密码: 
root@shanlei-Lenovo-ideapad-110-15ISK:~# 

成功~

————————————————————————-美丽的分割线—————————————————————————-

修改ubuntu默认shell的另外两种方式:

  • ln -s : 强制把/bin/sh的软链接改到bash中: sudo ln -s /bin/bash /bin/sh
  • dpkg-reconfigure dash:在Ubuntu中建议使用这个方法:sudo dpkg-reconfigure dash,弹出来个选择项,把“dash设为默认shell”选择no。
    怎样查看自己的机器上装了哪些shell?
shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ cat /etc/shells
# /etc/shells: valid login shells
/bin/sh
/bin/dash
/bin/bash
/bin/rbash
shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ 

怎样查看自己当前使用的shell是哪个?(注意SHELL一定要是大写!)

shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ echo $SHELL
/bin/bash
shanlei@shanlei-Lenovo-ideapad-110-15ISK:~$ 

执行了zsh之后,我查看当前shell类型仍然是/bin/bash呢?

当前的shell是一个大环境,是针对一个已登录用户而言的,而我们使用的bash或zsh只是启动了一个bash或zsh解释器程序而已,并没有改变大环境,如果想要改变改变大环境,必须使用chsh

通过ssh会话执行bash别名

SSH 客户端 (ssh) 是一个登录远程服务器并在远程系统上执行 shell 命令的 Linux/Unix 命令。它被设计用来在两个非信任的机器上通过不安全的网络(比如互联网)提供安全的加密通讯。

未分类

我在远程主机上上设置过一个叫做 file_repl 的 bash 别名 。当我使用 ssh 命令登录远程主机后,可以很正常的使用这个别名。然而这个 bash 别名却无法通过 ssh 来运行,像这样:

$ ssh [email protected] file_repl
bash:file_repl:command not found

我要怎样做才能通过 ssh 命令运行 bash 别名呢?

SSH 客户端 (ssh) 是一个登录远程服务器并在远程系统上执行 shell 命令的 Linux/Unix 命令。它被设计用来在两个非信任的机器上通过不安全的网络(比如互联网)提供安全的加密通讯。

如何用 ssh 客户端执行命令

通过 ssh 运行 free 命令或 date 命令 可以这样做:

$ ssh [email protected] date

结果为:

Tue Dec 26 09:02:50 UTC 2017

或者:

$ ssh [email protected] free -h

结果为:

 total used free shared buff/cache available
Mem:2.0G 428M 138M 145M 1.4G 1.1G
Swap:0B 0B 0B

理解 bash shell 以及命令的类型

bash shell 共有下面几类命令:

  • 别名,比如 ll
  • 关键字,比如 if
  • 函数 (用户自定义函数,比如 genpasswd)
  • 内置命令,比如 pwd
  • 外部文件,比如 /bin/date

type 命令 和 command 命令 可以用来查看命令类型:

$ type -a date
date is /bin/date
$ type -a free
free is /usr/bin/free
$ command -V pwd
pwd is a shell builtin
$ type -a file_repl
is aliased to `sudo -i /shared/takes/master.replication'

date 和 free 都是外部命令,而 file_repl 是 sudo -i /shared/takes/master.replication 的别名。你不能直接执行像 file_repl 这样的别名:

$ ssh user@remote file_repl

在 Unix 系统上无法直接通过 ssh 客户端执行 bash 别名
要解决这个问题可以用下面方法运行 ssh 命令:

$ ssh -t user@remote /bin/bash -ic 'your-alias-here'
$ ssh -t user@remote /bin/bash -ic 'file_repl'

ssh 命令选项:

  • -t:强制分配伪终端。可以用来在远程机器上执行任意的 基于屏幕的程序,有时这非常有用。当使用 -t 时你可能会收到一个类似 “bash: cannot set terminal process group (-1): Inappropriate ioctl for device. bash: no job control in this shell .” 的错误。

bash shell 的选项:

  • -i:运行交互 shell,这样 shell 才能运行 bash 别名。
  • -c:要执行的命令取之于第一个非选项参数的命令字符串。若在命令字符串后面还有其他参数,这些参数会作为位置参数传递给命令,参数从 $0 开始。

总之,要运行一个名叫 ll 的 bash 别名,可以运行下面命令:

$ ssh -t [email protected] -ic 'll'

结果为:

未分类

Running bash aliases over ssh based session when using Unix or Linux ssh cli

下面是我的一个 shell 脚本的例子:

#!/bin/bash
I="tags.deleted.410"
O="/tmp/https.www.cyberciti.biz.410.url.conf"
box="[email protected]"
[!-f "$I" ] && { echo "$I file not found。"; exit 10; }
>$O
cat "$I" | sort | uniq | while read -r u
do
    uu="${u##https://www.cyberciti.biz}"
    echo "~^$uu 1;" >>"${O}"
done
echo "Config file created at ${O} and now updating remote nginx config file"
scp "${O}" ${box}:/tmp/
ssh ${box} /usr/bin/lxc file push /tmp/https.www.cyberciti.biz.410.url.conf nginx-container/etc/nginx/
ssh -t ${box} /bin/bash -ic 'push_config_job'

相关资料

更多信息请输入下面命令查看 OpenSSH 客户端 和 bash 的 man 帮助 :

$ man ssh
$ man bash
$ help type
$ help command 

git找回工作区删除的文件

一不小心删除了一个文件怎么办?如果不小心删除一个文件,应该看到这样的提示:

Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)

        deleted:    app/Theme.php

此时直接git checkcout是不行的,应该先git reset HEAD app/Theme.php。注意看提示其实已经说了。
测试你再一次git status:

On branch master
Your branch is up-to-date with 'origin/master'.
Changes not staged for commit:
  (use "git add/rm <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)

        modified:   app/Http/Controllers/Controller.php
        deleted:    app/Theme.php
        modified:   readme.md
        modified:   resources/views/show_partials/item_themes.blade.php
        modified:   resources/views/wlddy/show.blade.php
        modified:   resources/views/wlddy/wlddyform.blade.php
        modified:   resources/views/wlj/wljform.blade.php

修改已经到了not staged的分组了。这个时候,你再git checkout Apptheme.php就可以了!

Git 清理历史提交文件缓存

在刚开始使用 git 的过程中,由于对 git 的工作方式不甚了解,总会产生一些很傻很天真的操作。比如,为了方便项目读取,将二进制文件和代码一起提交到了 git 仓库;亦或者一不小心,将本地打出来的部署包一同提交到了 git 仓库,导致整个项目庞大无比,别人在克隆项目时苦不堪言。虽然可以重建项目,但是又不想丢弃提交记录,该怎么解决呢?

其实我们可以通过 git 命令,来清除文件缓存,而不清除提交记录。

比如,当初为了方便部署,将应用部署包放入 files 文件夹一同提交到了 git 仓库,现在虽然已经删除部署包后重新提交,但是部署包依然后存在于提交记录(以便回退)。我们可以按以下步骤清除指定文件缓存。

步骤 1:整理需要删除缓存的包及路径

整理出包相对于项目的路径。比如,整理出路径如下:

roles/tomcat/files/apache-tomcat-7.0.52.tgz
roles/GraphicsMagickDeployment/files/ImageServer.tar.gz
roles/GraphicsMagickDeployment/files/probe.tar.gz
roles/java/files/jdk1.7.0_51.tgz
roles/tomcat-yuminstall/files/apache-tomcat-7.0.52.tgz
roles/redis/files/redis-2.8.13.tgz
roles/zookeeper/files/zookeeper-3.4.6.tar.gz

步骤 2:执行命令清除缓存

清除命令如下:

git filter-branch --index-filter 
'git rm --cached --ignore-unmatch 
roles/tomcat/files/apache-tomcat-7.0.52.tgz 
roles/GraphicsMagickDeployment/files/ImageServer.tar.gz 
roles/GraphicsMagickDeployment/files/probe.tar.gz 
roles/java/files/jdk1.7.0_51.tgz 
roles/tomcat-yuminstall/files/apache-tomcat-7.0.52.tgz 
roles/redis/files/redis-2.8.13.tgz 
roles/zookeeper/files/zookeeper-3.4.6.tar.gz' 
-f -- --all

执行后, git 会遍历所有的提交,删除相关记录及文件(只删除提交记录中的文件记录,并不会删除整个提交),所以过程需要等待。

需要注意的是,清除后的文件无法通过提交记录还原。

步骤 3:删除原有项目并重建

需在 git 仓库上删除原有项目并重新提交,才可顺利进行,否则会出新冲突。

步骤 4:删除本地项目后重新克隆

若不删除本地项目,重新拉会导致冲突,所以执行操作前,最好先通知本地人员提交当前版本,并等待操作完成。

Git只拉取部分代码

在某些情况下,我们会有从git上拉取部分文件的需求。

下面脚本就演示了如何从gitlab中只拉取需要的文件:

#!/bin/bash
# 拼接git地址,并加上权限
GITLAB_PROTOCOL=https://
GITLAB_USER=xxx
GITLAB_PASSWD=xxx
GITLAB_ADDRESS=git.xxx.com
GITLAB_GOURP=xxxxxx
PROJECT_NAME=xxxxxx
CLONE_ADDRESS=$GITLAB_PROTOCOL$GITLAB_USER':'$GITLAB_PASSWD'@'$GITLAB_ADDRESS'/'$GITLAB_GOURP'/'$PROJECT_NAME'.git'

# 初始化
git init 
# 添加源
git remote add origin $CLONE_ADDRESS
# 配置sparsecheckout为true
git config core.sparsecheckout true
# 把要拉取的文件目录加入到.git/info/sparse-checkout文件中
echo "dockerfile*" >> .git/info/sparse-checkout
echo "*.sh" >> .git/info/sparse-checkout
# 拉取文件
git pull origin master

pull完成之后所有dockerfile和脚本文件就会被下载到本地。

Git 忽略提交 .gitignore

在使用Git的过程中,我们喜欢有的文件比如日志,临时文件,编译的中间文件等不要提交到代码仓库,这时就要设置相应的忽略规则,来忽略这些文件的提交。

Git 忽略文件提交的方法

有三种方法可以实现忽略Git中不想提交的文件。

在Git项目中定义 .gitignore 文件

这种方式通过在项目的某个文件夹下定义 .gitignore 文件,在该文件中定义相应的忽略规则,来管理当前文件夹下的文件的Git提交行为。

.gitignore 文件是可以提交到共有仓库中,这就为该项目下的所有开发者都共享一套定义好的忽略规则。

在 .gitingore 文件中,遵循相应的语法,在每一行指定一个忽略规则。如:

*.log
*.temp
/vendor

在Git项目的设置中指定排除文件

这种方式只是临时指定该项目的行为,需要编辑当前项目下的 .git/info/exclude 文件,然后将需要忽略提交的文件写入其中。

需要注意的是,这种方式指定的忽略文件的根目录是项目根目录。

定义Git全局的 .gitignore 文件

除了可以在项目中定义 .gitignore 文件外,还可以设置全局的 git .gitignore 文件来管理所有Git项目的行为。这种方式在不同的项目开发者之间是不共享的,是属于项目之上Git应用级别的行为。

这种方式也需要创建相应的 .gitignore 文件,可以放在任意位置。然后在使用以下命令配置Git:

git config --global core.excludesfile ~/.gitignore

Git 忽略规则

详细的忽略规则可以参考官方英文文档: https://git-scm.com/docs/gitignore

Git 忽略规则优先级

在 .gitingore 文件中,每一行指定一个忽略规则,Git 检查忽略规则的时候有多个来源,它的优先级如下(由高到低):

  • 从命令行中读取可用的忽略规则
  • 当前目录定义的规则
  • 父级目录定义的规则,依次地推
  • $GIT_DIR/info/exclude 文件中定义的规则
  • core.excludesfile中定义的全局规则

Git 忽略规则匹配语法

在 .gitignore 文件中,每一行的忽略规则的语法如下:

  • 空格不匹配任意文件,可作为分隔符,可用反斜杠转义
  • # 开头的文件标识注释,可以使用反斜杠进行转义
  • ! 开头的模式标识否定,该文件将会再次被包含,如果排除了该文件的父级目录,则使用 ! 也不会再次被包含。可以使用反斜杠进行转义
  • / 结束的模式只匹配文件夹以及在该文件夹路径下的内容,但是不匹配该文件
  • / 开始的模式匹配项目跟目录
  • 如果一个模式不包含斜杠,则它匹配相对于当前 .gitignore 文件路径的内容,如果该模式不在 .gitignore 文件中,则相对于项目根目录
  • ** 匹配多级目录,可在开始,中间,结束
  • ? 通用匹配单个字符
  • [] 通用匹配单个字符列表

常用匹配示例

  • bin/: 忽略当前路径下的bin文件夹,该文件夹下的所有内容都会被忽略,不忽略 bin 文件
  • /bin: 忽略根目录下的bin文件
  • /*.c: 忽略 cat.c,不忽略 build/cat.c
  • debug/*.obj: 忽略 debug/io.obj,不忽略 debug/common/io.obj 和 tools/debug/io.obj
  • **/foo: 忽略/foo, a/foo, a/b/foo等
  • a/**/b: 忽略a/b, a/x/b, a/x/y/b等
  • !/bin/run.sh: 不忽略 bin 目录下的 run.sh 文件
  • *.log: 忽略所有 .log 文件
  • config.php: 忽略当前路径的 config.php 文件

.gitignore规则不生效

.gitignore只能忽略那些原来没有被track的文件,如果某些文件已经被纳入了版本管理中,则修改.gitignore是无效的。

解决方法就是先把本地缓存删除(改变成未track状态),然后再提交:

git rm -r --cached .
git add .
git commit -m 'update .gitignore'

git修改远程仓库地址

问:Coding远程仓库地址变了,本地git仓库地址如何更新为最新地址

git修改远程仓库地址

方法有三种:

1、修改命令

git remote origin set-url [url]

2、先删后加

git remote rm origin
git remote add origin [url]

3、直接修改config文件

git 远程仓库管理

要参与任何一个 Git 项目的协作,必须要了解该如何管理远程仓库.远程仓库是指托管在网络上的项目仓库,可能会有好多个,其中有些你只能读,另外有些可以写.同他人协作开发某 个项目时,需要管理这些远程仓库,以便推送或拉取数据,分享各自的工作进展.管理远程仓库的工作,包括添加远程库,移除废弃的远程库,管理各式远程库分 支,定义是否跟踪这些分支,等等.本节我们将详细讨论远程库的管理和使用.

查看当前的远程库

要查看当前配置有哪些远程仓库,可以用 git remote 命令,它会列出每个远程库的简短名字.在克隆完某个项目后,至少可以看到一个名为 origin 的远程库,Git 默认使用这个名字来标识你所克隆的原始仓库:

  $ git clone git://github.com/schacon/ticgit.git

  Initialized empty Git repository in /private/tmp/ticgit/.git/

  remote: Counting objects: 595, done.

  remote: Compressing objects: 100% (269/269), done.

  remote: Total 595 (delta 255), reused 589 (delta 253)

  Receiving objects: 100% (595/595), 73.31 KiB | 1 KiB/s, done.

  Resolving deltas: 100% (255/255), done.

  $ cd ticgit

  $ git remote

  
origin也可以加上 -v 选项(译注:此为 ?verbose 的简写,取首字母),显示对应的克隆地址:

$ git remote -v

origin git://github.com/schacon/ticgit.git如果有多个远程仓库,此命令将全部列出.比如在我的 Grit 项目中,可以看到:

  $ cd grit

  $ git remote -v

  bakkdoor git://github.com/bakkdoor/grit.git

  cho45 git://github.com/cho45/grit.git

  defunkt git://github.com/defunkt/grit.git

  koke git://github.com/koke/grit.git

origin [email protected]:mojombo/grit.git这样一来,我就可以非常轻松地从这些用户的仓库中,拉取他们的提交到本地.请注意,上面列出的地址只有 origin 用的是 SSH URL 链接,所以也只有这个仓库我能推送数据上去(我们会在第四章解释原因).

添加远程仓库

要添加一个新的远程仓库,可以指定一个简单的名字,以便将来引用,运行 git remote add [shortname] [url]:

  $ git remote

  origin

  $ git remote add pb git://github.com/paulboone/ticgit.git

  $ git remote -v

  origin git://github.com/schacon/ticgit.git

pb git://github.com/paulboone/ticgit.git现在可以用字串 pb 指代对应的仓库地址了.比如说,要抓取所有 Paul 有的,但本地仓库没有的信息,可以运行 git fetch pb:

  $ git fetch pb

  remote: Counting objects: 58, done.

  remote: Compressing objects: 100% (41/41), done.

  remote: Total 44 (delta 24), reused 1 (delta 0)

  Unpacking objects: 100% (44/44), done.

  From git://github.com/paulboone/ticgit

  * [new branch] master -> pb/master

  • [new branch] ticgit -> pb/ticgit现在,Paul 的主干分支(master)已经完全可以在本地访问了,对应的名字是 pb/master,你可以将它合并到自己的某个分支,或者切换到这个分支,看看有些什么有趣的更新.

从远程仓库抓取数据

正如之前所看到的,可以用下面的命令从远程仓库抓取数据到本地:

$ git fetch [remote-name]此命令会到远程仓库中拉取所有你本地仓库中还没有的数据.运行完成后,你就可以在本地访问该远程仓库中的所有分支,将其中某个 分支合并到本地,或者只是取出某个分支,一探究竟.(我们会在第三章详细讨论关于分支的概念和操作.)

如果是克隆了一个仓库,此命令会自动将远程仓库归于 origin 名下.所以,git fetch origin 会抓取从你上次克隆以来别人上传到此远程仓库中的所有更新(或是上次 fetch 以来别人提交的更新).有一点很重要,需要记住,fetch 命令只是将远端的数据拉到本地仓库,并不自动合并到当前工作分支,只有当你确实准备好了,才能手工合并.(说 明:事先需要创建好远程的仓库,然后执行:git remote add [仓库名] [仓库url],git fetch [远程仓库名],即可抓取到远程仓库数据到本地,再用git merge remotes/[仓库名]/master就可以将远程仓库merge到本地当前branch.这种分支方式比较适合独立-整合开发,即各自开发测试好后 再整合在一起.比如,Android的Framework和AP开发.

可以使用–bare 选项运行git init 来设定一个空仓库,这会初始化一个不包含工作目录的仓库.

  $ cd /opt/git

  $ mkdir project.git

  $ cd project.git

$ git –bare init这时,Join,Josie 或者Jessica 就可以把它加为远程仓库,推送一个分支,从而把第一个版本的工程上传到仓库里了.)

如果设置了某个分支用于跟踪某个远端仓库的分支(参见下节及第三章的内容),可以使用 git pull 命令自动抓取数据下来,然后将远端分支自动合并到本地仓库中当前分支.在日常工作中我们经常这么用,既快且好.实际上,默认情况下 git clone 命令本质上就是自动创建了本地的 master 分支用于跟踪远程仓库中的 master 分支(假设远程仓库确实有 master 分支).所以一般我们运行 git pull,目的都是要从原始克隆的远端仓库中抓取数据后,合并到工作目录中当前分支.

推送数据到远程仓库

项目进行到一个阶段,要同别人分享目前的成果,可以将本地仓库中的数据推送到远程仓库.实现这个任务的命令很简单: git push [remote-name] [branch-name].如果要把本地的 master 分支推送到 origin 服务器上(再次说明下,克隆操作会自动使用默认的 master 和 origin 名字),可以运行下面的命令:

$ git push origin master只有在所克隆的服务器上有写权限,或者同一时刻没有其他人在推数据,这条命令才会如期完成任务.如果在你推数据前,已经有其他人推送了若干更新,那 你的推送操作就会被驳回.你必须先把他们的更新抓取到本地,并到自己的项目中,然后才可以再次推送.有关推送数据到远程仓库的详细内容见第三章.

查看远程仓库信息

我们可以通过命令 git remote show [remote-name] 查看某个远程仓库的详细信息,比如要看所克隆的origin 仓库,可以运行:

  $ git remote show origin

  * remote origin

  URL: git://github.com/schacon/ticgit.git

  Remote branch merged with 'git pull' while on branch master

  master

  Tracked remote branches

  master

  
ticgit除了对应的克隆地址外,它还给出了许多额外的信息.它友善地告诉你如果是在 master 分支,就可以用git pull 命令抓取数据合并到本地.另外还列出了所有处于跟踪状态中的远端分支.

实际使用过程中,git remote show 给出的信息可能会像这样:

  $ git remote show origin

  * remote origin

  URL: [email protected]:defunkt/github.git

  Remote branch merged with 'git pull' while on branch issues

  issues

  Remote branch merged with 'git pull' while on branch master

  master

  New remote branches (next fetch will store in remotes/origin)

  caching

  Stale tracking branches (use 'git remote prune')

  libwalker

  walker2

  Tracked remote branches

  acl

  apiv2

  dashboard2

  issues

  master

  postgres

  Local branch pushed with 'git push'

  
master:master它告诉我们,运行 git push 时缺省推送的分支是什么(译注:最后两行).它还显示了有哪些远端分支还没有同步 到本地(译注:第六行的 caching 分支),哪些已同步到本地的远端分支在远端服务器上已被删除(译注:Stale tracking branches 下面的两个分支),以及运行 git pull 时将自动合并哪些分支(译注:前四行中列出的 issues 和 master 分支).(此命令也可以查看到本地分支和远程仓库分支的对应关系.)

远程仓库的删除和重命名

在新版 Git 中可以用 git remote rename 命令修改某个远程仓库的简短名称,比如想把 pb 改成 paul,可以这么运行:

  $ git remote rename pb paul

  $ git remote

  origin

paul注意,对远程仓库的重命名,也会使对应的分支名称发生变化,原来的 pb/master 分支现在成了paul/master.

碰到远端仓库服务器迁移,或者原来的克隆镜像不再使用,又或者某个参与者不再贡献代码,那么需要移除对应的远端仓库,可以运行 git remote rm 命令:

  $ git remote rm paul

  $ git remote

  origin

从撤销 rebase 谈谈 git 原理

假设我们有两个分支,a 和 b,它们的提交都有一个相同的父提交(master 指向的那次提交)。如图所示:

未分类

现在我们在分支 b 上,然后 rabase 到分支 a 上。如图所示:

未分类

平时开发中经常遇到这种情况,假设分支 a 和 b 是两个独立的 feature 分支,但是不小心被我们错误的 rebase 了。现在相当于两个 feature 分支中原本独立的业务被揉起来了,当然是我们不想看到的结果,那么如何撤销呢?

一种方案是利用 reflog 命令。

利用 reflog 撤销变基

我们先不考虑原理,直接上解决方案,首先输入 git reflog,你会看到如下图所示的日志:

未分类

最后的输出其实是最早的操作,我们逐条分析下:

  • HEAD@{8}: 这里我们创建了初始的提交
  • HEAD@{7}:检出了分支 a
  • HEAD@{6}:在分支 a 上做了一次提交,注意 master 分支没有变动
  • HEAD@{5}:从分支 a 回到分支 master,相当于向后退了一次
  • HEAD@{4}:检出了分支 b
  • HEAD@{3}:在分支 b 上做了一次提交,注意 master 分支没有变动
  • HEAD@{2}:这一步开始变基到分支 a,首先切换到分支 a 上
  • HEAD@{1}:把分支 b 对应的那次提交变基到分支 a 上
  • HEAD@{0}:变基结束,因为是在 b 上发起的变基,所以最后还切回分支 b

如果我们想撤销此次 rebase,只要输入以下命令就可以了:

git reset --hard HEAD@{3}

此时再看,已经“恢复”到 rebase 前的状态了。的是不是感觉很神奇呢,先别着急,后面会介绍这么做的原理。

git 工作原理简介

为了搞懂 git 是如何工作的,以及这些命令背后的原理,我想有必要对 git 的模型有基础的了解。

首先,每一个 git 目录都有一个名为 .git 的隐藏目录,关于 git 的一切都存储于这个目录里面(全局配置除外)。这个目录里面有一些子目录和文件,文件其实不重要,都是一些配置信息,后面会介绍其中的 HEAD 文件。子目录有以下几个:

  • info:这个目录不重要,里面有一个 exclude 文件和 .gitignore 文件的作用相似,区别是这个文件不会被纳入版本控制,所以可以做一些个人配置。

  • hooks:这个目录很容易理解, 主要用来放一些 git 钩子,在指定任务触发前后做一些自定义的配置,这是另外一个单独的话题,本文不会具体介绍。

  • objects:用于存放所有 git 中的对象,下面单独介绍。

  • logs:用于记录各个分支的移动情况,下面单独介绍。

  • refs:用于记录所有的引用,下面单独介绍。

本文主要会介绍后面三个文件夹的作用。

git 对象

git 是面向对象的!
git 是面向对象的!
git 是面向对象的!

没错,git 是面向对象的,而且很多东西都是对象。我举个简单的例子,来帮助大家理解这个概念。假设我们在一个空仓库里,编辑了 2 个文件,然后提交。此时都会有那些对象呢?
首先会有两个数据对象,每个文件都对应一个数据对象。当文件被修改时,即使是新增了一个字母,也会生成一个新的数据对象。
其次,会有一个树对象用来维护一系列的数据对象,叫树对象的原因是它持有的不仅可以是数据对象,还可以是另一个树对象。比如某次提交了两个文件和一个文件夹,那么树对象里面就有三个对象,两个是数据对象,文件夹则用另一个树对象表示。这样递归下去就可以表示任意层次的文件了。
最后则是提交对象,每个提交对象都有一个树对象,用来表示某一次提交所涉及的文件。除此以外,每一个提交还有自己的父提交,指向上一次提交的对象。当然,提交对象还会包含提交时间、提交者姓名、邮箱等辅助信息,就不多说了。
假设我们只有一个分支,以上知识点就足够解释 git 的提交历史是如何计算的了。它并不存储完整的提交历史,而是通过父提交的对象不断向前查找,得出完整的历史。
注意开头那张图片,分支 b 指向的提交是 9cbb015,不妨来看下它是何方神圣:

git cat-file -t 9cbb015
git cat-file -p 9cbb015

这里我们使用 cat-file 命令,其中 -t 参数打印对象的类型,-p 参数会智能识别类型,并打印其中的内容。输出结果如图所示:

未分类

可见 9cbb015 是一个提交对象,里面包含了树对象、父提交对象和各种配置信息。我们可以再打印树对象看看:

未分类

这表示本次提交只修改了 begin 这个文件,并且输出了 begin 这个文件对于的数据对象。

git 引用

既然 git 是面向对象的,那么有没有指正呢?还真是有的,分支和标签都是指向提交对象的指针。这一点可以验证:

cat .git/refs/heads/a

所有的本地分支都存储在 git/refs/heads 目录下,每一个分支对应一个文件,文件的内容如图所示:

未分类

可见,4a3a88d 刚好是本文第一张图中分支 a 所指向的提交。

我们已经搞明白了 git 分支的秘密,现在有了所有分支的记录,又有了每次提交的父提交对象,就能够得出像 SourceTree 或者文章开头第一张图那样的提交状态了。

至于标签,它其实也是一种引用,可以理解为不能移动的分支。只能永远指向某个固定的提交。

最后一个比较特殊的引用是 HEAD,它可以理解为指针的指针,为了证明这一点,我们看看 .git/HEAD 文件:

未分类

它的内容记录了当前指向哪个分支,refs/heads/b 其实是一个文件,这个文件的内容是分支 b 指向的那个提交对象。理解这一点非常重要,否则你会无法理解 checkout 和 reset 的区别。
这两个命令都会改变 HEAD 的指向,区别是 checkout 不改变 HEAD 指向的分支的指向,而 reset 会。举个例子, 在分支 b 上执行以下两个命令都会让 HEAD 指向 4a3a88d 这次提交(分支 a 指向的提交):

git checkout a
git reset --hard a

但 checkout 仅改变 HEAD 的指向,不会改变分支 b 的指向。而 reset 不仅会改变 HEAD 的指向,还因为 HEAD 指向分支 b,就把 b 也指向 4a3a88d 这次提交。

git 日志

在 .git/logs 目录中,有一个文件夹和一个 HEAD 文件,每当 HEAD 引用改变了指向的位置,就会在 .git/logs/HEAD 中添加了一个记录。而 .git/logs/refs/heads 这个目录中则有多个文件,每个文件对应一个分支,记录了这个分支 的指向位置发生改变的情况。
当我们执行 git reflog 的时候,其实就是读取了 .git/logs/HEAD 这个文件。

未分类

撤销 rebase 的原理

首先我们要排除一个误区,那就是 git 会维护每次提交的提交对象、树对象和数据对象,但并不会维护每次提交时,各个分支的指向。在介绍分支的那一节中我们已经看到,分支仅仅是一个保留了提交对象的文件而已,并不记录历史信息。即使在上一节中,我们知道分支的变化信息会被记录下来,但也不会和某个提交对象绑定。

也就是说,git 中并不存在某次提交时的分支快照

那么我们是如何通过 reset 来撤销 rebase 的呢,这里还要澄清另一个事实。前文曾经说过,某个时刻下你通过 SourceTree 或者 git log 看到的分支状态,其实是由所有分支的列表、每个分支所指向的提交,和每个提交的父提交共同绘制出来的。

首先 git/refs/heads 下的文件告诉我们有多少分支,每个文件的内容告诉我们这个分支指向那个提交,有了这个提交不断向前追溯就绘制出了这个分支的提交历史。所有分子的提交历史也就组成了我们看到的状态。
但我们要明确:不是所有提交对象都能看到的,举个例子如果我们把某个分支向前移一次提交,那个分支的提交线就会少一个节点,如果没有别的提交线包含这个节点,这个节点就看不到了。

所以在 rebase 完成后,我们以为看到了下面这样的提交线:

df0f2c5(master) --- 4a3a88d(a) --- 9cbb015(b)

实际上是这样的:

df0f2c5(master) --- 4a3a88d(a) --- 9d0618e(b)
   |
9cbb015

master 分支上依然有分叉,原来 9cbb015 这次提交依然存在,只不过没有分支的提交线包含它,所以无法看到而已。但是通过 reflog,我们可以找回 HEAD 头的每一次移动,所以能看到这次提交。

当我们执行这个命令时:

git reset --hard HEAD@{3}

再看一次 reflog 的输出:

未分类

HEAD@{3} 其实是它左侧 9cbb015 这次提交的缩写,所以上述命令等价于:

git reset --hard 9cbb015

前文说过,reset 不仅会移动 HEAD,还会移动 HEAD 所指向的分支,所以这个命令的执行结果就是让 HEAD 和分支 b 同时指向 9cbb015 这个提交,看起来像是撤销了 rebase。

但别忘了,分支 a 的上面还是有一次提交的,9d0618e 这次提交仅仅是没有分支指向它,所以不显示而已。但它真实的存在着,严格意义上来说,我们并没有真正的撤销此次 rebase。