git到svn双向同步的实现

这算是一个比较常见的场景,比如:不同的团队直接合作通过svn管理代码,但是团队内部用确是git;或者历史遗留项目已经在svn上了不能动,但是团队想使用git。注意这里svn或者git并不是彼此的一个mirror,而是需要双向同步。

作为半个devops我接到这个场景前前后后花了3周的时间吧,在stackoverflow上有这个问题的讨论:https://stackoverflow.com/questions/907913,里面有3个可以参考的解决方案。由于我这边的基础设施有自己的限制,经过研究之后发现现成的3个方案都不满足,所以最终决定自己手撸一个git到svn的双向同步方案。

具体实现如下:

本地的git仓库是通过自建gitlab托管的(已经包含了docker registry),然后搭建了jenkins。同步逻辑本身就是一个gitlab上的项目,该项目一更新就触发jenkins任务,在jenkins任务中根据写好的Jenkinsfile来build好一个docker镜像,然后上传到docker registry中供别人使用。现在同事A要把gitlab上的仓库repo1和远程的svn仓库进行一个双向同步,那么他只需要按照模版新建一个Jenkins任务,在jenkins任务里面通过启动预先build好的同步逻辑的docker镜像,同步挂载当前工作目录(也就是jenkins刚从gitlab同步下来的git仓库目录)到docker容器内部,然后在镜像中完成git到svn的双向同步逻辑。读到这里你可能觉得还是挺简单的,但是有个限制条件是svn是不能在本地Jenkins中直接访问的,必须通过远程开发机才能访问,这就让问题的复杂度直线上升了

怎么办呢?只有在同步逻辑中先通过ssh连上远程开发机,远程执行手动双向同步的逻辑咯,这里面涉及到非常繁琐的内容处理,一整套撸下来我对shell、git、svn、jenkins和docker的认识都上了一个层次。

执行同步逻辑的时候分两步走:

1、svn到gitlab的同步:通过在同步逻辑中通过sshpass连上开发服务器,进入checkout出来的svn代码目录,然后在该目录下创建一个新的git仓库(注意这里用的git init没有–bare),把git和svn彼此忽略’.git’和’.svn’的设置弄好。执行svn更新,手动的去解析svn的历史log,得到一份需要转换到git的历史svn的revision列表,然后根据这份列表从头开始svn update -r REVISION_NO这样把当前目录重置到REVISION_NO对应的快照,接着git add -A && git commit完成转换。然后jenkins中就git fetch来把开发服务器上的git更新拉下来,然后merge到本地分支的时候需要禁止冲突(如果冲突了以哪个代码仓库为准需要参考-Xthers/-Xours这个git merge的选项),完了之后再merge到gitlab的远程分支,最后push到gitlab上。

2、gitlab到svn的同步:这其实是一个反向的逻辑,我这里就列出一些别的细节。有时候一个git的commit可能对应一个空的svn的revision,反过来也是如此,需要处理这种情况。在merge两个不同历史的分支时,参考git的-allow-unrelated-histories选项。由于svn的分支实际上就是目录,而开发服务器上用来转化的git仓库也只用master分支。gitlab上某个仓库有多分支需要同步到svn的不同子目录(分支)的时候,为了简化问题需要在开发服务器上checkout不同的svn子目录(分支),然后写多个jenkins任务来完成同步。为了记得上次同步了哪些commit/revision,需要找个地方记住,这里我选了开发服务器上的.git目录内部。svn和git在add、commit和恢复快照的时候会遇到不同的特殊情况,为了处理这些特殊情况花了我很大的精力

如你所见,如果我在jenkins里面能直接访问svn仓库的话,我可以直接在jenkins里面checkout svn仓库,然后完成git到svn的双向同步。但是很遗憾只有远程开发机能连上svn仓库,而开发机我只有一个ssh权限,所以在jenkins里面通过ssh来远程完成转换,然后在通过git over ssh的方式完成git更新的上传和下载,这种操作是非常风骚的,需要强大的内容处理技巧。

最后关于冲突后数据丢失的问题,我是这么想的,由于commit到gitlab上的东西是丢不了的,所以merge的时候发生了冲突就以来自svn的更新为准。这样数据是丢不了,但是发生了冲突之后,一切同步都是照常进行的,没有任何提示。

业务逻辑我用的熟悉php写的,最后加起来700多行吧,加上别的expect脚本、Jenkinsfile、Dockerfile啥的1000行以内搞定,没有依赖git svn插件完全手动转换。

发表评论

电子邮件地址不会被公开。 必填项已用*标注