[請益] 大型Git版本庫的備份或替代方案

軟工

61421

我有一些大型的Git版本庫,存放特定專案要用到的文獻資料。
目前檔案大約2000餘個,大多是pdf、doc(x)檔案及一些文字檔,
單檔大小可達數百MB,版本庫總大小約數十GB。
由於總版本庫過大,無法同步到 GitHub、GitLab 備份。

使用Git管理的原因是這些檔案修改內容時希望有版本回溯機制,
有時也會有資料夾層級的重整(移動至其他資料夾、更改檔名等),
一樣希望有資料夾層級的版本回溯機制。
此外希望版本記錄是可自訂的(類似 Google 雲端硬碟的永久保存版本),
並且以開放格式儲存(而不是只存在 NAS 內部)。
目前是 Git 用得比較順手,但如果有更好的備份及版控方案會考慮。

不曉得各位先進有這麼大的Git版本庫時,會用什麼方式做備份?

除了備份到外接硬碟可以直接在本機操作 push, pull 以外,
如果想備份到其他電腦,遠端桌面連線無法做Git同步...
Syncthing 之類的檔案同步方式也不適合用於Git...

有在想架設 NAS,
但不曉得 NAS 是否允許 Git 同步以及內部操作 repack 等維護?
(repack 大型 repo 怕因為記憶體或 CPU 限制而無法完成,
或過程中整個 NAS 掛掉)

或者有其他比Git更好的替代方案?


(目前沒看到更適合討論Git問題的版,如有更適合的版歡迎告知)

--
《終結內容農場》瀏覽器套件
Chrome: http://bit.ly/CFTGC (桌機 & Kiwi Browser on Android)
Firefox: http://bit.ly/CFTFx (桌機 & Firefox for Android)
真相:http://bit.ly/CFTss1
http://bit.ly/CFTss2

詳細介紹:http://bit.ly/CFTinfo


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.137.15.240 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1643728676.A.1B4.html
forever2151樓自己架Git Server 在弄一套Mirror 就備份完了 02/01 23:21
想問有什麼具體的架設方案嗎? 假如兩台都是 Windows 電腦,有什麼簡單的架設方案嗎? 考慮過 NAS,擔心的問題如上所述。 我知道還有一招是租 VPS 架 Git server, 不過 VPS 普遍是用於架網站,單位容量價格偏高, 如果是純做資料備份似乎不太划算,因此打算作為最後線備案。
neo52772樓自己組電腦,裝一個gitserver這樣,然後多備份一個? 02/01 23:28
MoonCode4樓ur-own-git-server/ 02/01 23:53
MoonCode5樓 02/01 23:54
MoonCode6樓h-files/managing-large-files/about-git-large-file-s 02/01 23:54
MoonCode7樓torage 02/01 23:54
目前的問題應該是 Windows。 對於另一台 Linux 電腦,只要架起 SSH 就可以 git remote 了。 但是 Windows 的 OpenSSH 似乎不能這樣做。 專門組一台 Linux 電腦理論上是做得到, 但只為了幾十 GB 的版本庫組一台電腦不太划算, 希望能可以的話能和其他資料備份用同一台 NAS 解決。 (NAS 還在評估可行性未入手。如果無解可能只好架一台 Linux server 當 NAS?)
joshua52018樓你的東西都是binary 不適合git吧 那個也很難看diff 02/02 00:13
joshua52019樓s3/gcs那種的容量便宜每個檔案加個timestamp上去 02/02 00:13
doc 檔案的話其實 TortoiseGit 就有支援 diff,其實不差。 pdf 目前還沒找到 diff 方案,不過有版控總是聊勝於無。 你所謂加個 timestamp 是指手動檔案命名像 myfile.20220202.docx 這樣嗎? 這樣不是比 git 更傳統原始?XD
longlyeagle10樓binary用git版控很怪吧... 不如自己出個hash管理 02/02 00:35
longlyeagle11樓不然你乾脆用 amazon s3 直接用 versioning 功能最快 02/02 00:37
不太懂「自己出個hash管理」具體是指什麼?XD 目前主要仍是以本地作業為主,只是要找備份方案。 Amazon S3 似乎是純雲端服務?不曉得如何能滿足目前的需求?
musie12樓1. Perforce 2. Mecurial 02/02 00:37
Mercurial 我以前用過,基本上沒 Git 好用,看不出來哪裡能解決問題? Perforce 似乎是付費VCS,能否說說有什麼feature能幫我解決問題?
forewero13樓直接上aws codecommit 他也是git 你的量應該是免費 02/02 00:49
AWS 應該沒有免費支援數十GB的私人repo...
roccqqck14樓pdf或圖片這種東西本來就不適合用git 02/02 00:59
roccqqck15樓這種東西還不如用單純用檔名+日期 02/02 01:00
roccqqck16樓你單檔能百mb一定是大量圖片的doc或pdf 02/02 01:03
yfr17樓我有一招很鬧,但我現在的確正在使用,Mac的時光機 02/02 01:05
roccqqck18樓除非你用latex或markdown或html 02/02 01:06
roccqqck19樓不然一堆圖片的檔案 你就算版控每次都超佔容量 02/02 01:06
yoche200020樓搞個VM呢 邏輯上的 stand alone server 02/02 01:26
本機使用時用 VM 效能會變差... 不過如果真的沒有 Windows to Windows 的同步方案, 可能最後會選擇用 VM 架一個 Linux git server 吧...
pttworld21樓windows你用gitblit這套免費的,硬碟容量你裝幾T應該夠 02/02 01:47
pttworld22樓基本上自己組一台桌上型最省錢,容量要多大有多大 02/02 01:49
DiLegend23樓聽起來直接用nas檔案管理就好吧? 02/02 02:00
DiLegend24樓一堆pdf你git也看不出改什麼吧 02/02 02:00
now9925樓檔案用git ? 02/02 02:04
now9926樓乾脆ftp nas 快照備份 02/02 02:05
Apache27樓git lfs 02/02 03:06
ken820328樓AWS S3 啊,開啟 versioning,同檔名的可以有版本區別, 02/02 03:37
ken820329樓所以你只要無腦蓋過去就好了 02/02 03:37
jimmy789lee30樓git lfs 正解 02/02 03:56
不曉得 LFS 如何解決 Git 跨機器同步的問題?
更多請益
[請益] offer請益
[請益] 高薪工作技能要如何獲得?
[請益] Delphi不流行的原因?
[請益] 請問關於金財通
[請益] 代po offer選擇(外商/趨勢)
[請益] 菜鳥金融IT職涯請益
[請益] 軟體更上一層樓?
[請益] 新手如何入門第一個script語言