[請益] 備份網站的技術?

軟工

56281

花了很多P幣,跟時間再研究google跟備份網站

備份網站不是用多線程爬蟲技術嗎?

但是好像發現了,沒有這麼簡單

好像每個版,測試過,被備份的方式不同....

說簡單,但也不簡單

這類網站所依賴的技術,其實滿簡單的

但是PTT只要發文權限跟方式不改,永遠都一定會被備份

發文的那個瞬間,因為很多地方不能改變,只能發文後再改

所以,第一次的文章標題,還有發文者一定會被紀錄

本文可以修改,所以必須等第二次才能解決

想問一下,PTT備份網站,像是PTTWEB 所仰賴的技術.....

謝謝!

損失好多P幣跟時間,血淚,才得到這種結論.....

人腦真的比不上電腦QQ

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.137.62.1 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1633743659.A.19F.html
gasbomb1樓……有人看得懂這篇嗎? 10/09 10:03
yinxuanh2樓伸手文啊 10/09 10:08
loadingN3樓為什麼會損失p幣 10/09 10:09
PttLite5樓看標題進來因為是DB backup或snapshot結果是爬蟲...我快 10/09 11:08
PttLite6樓跟不上時代了.. 10/09 11:08
qrtt17樓看不懂想要幹麻 10/09 11:55
wahaha2798樓看不懂在說什麼 10/09 11:58
yougigun9樓我也跟不上你的腦 10/09 12:02
brianhsu10樓請先閱讀「提問的智慧」,謝謝。 10/09 12:09
chocopie11樓先定義你要備份的內容是甚麼。 10/09 12:50
chocopie12樓是原本的內容一模一樣?還是只爬文章文字內容? 10/09 12:50
JimRoid13樓看標題我以為你是要問快照之類的 10/09 12:55
utdsml14樓原 po 應該是想問備份 PTT 裡面所有發推文紀錄的網站 10/09 13:02
moom5030215樓ctrl+S…? 10/09 13:05
eduishappy16樓我覺得PTT備份文章的網站真的好厲害喔!全都可以記錄 10/09 13:06
stupid031917樓偷取別人網站內容叫備份¿¿¿ 10/09 13:37
geroge082018樓這就是工程師和客戶之間的思維差異 10/09 13:43
kyoe19樓只要格式固定,都可以被解析 10/09 13:47
flypaper20樓我程度太差看不懂 QQ 10/09 14:31
roccqqck21樓爬蟲作業自己寫欸 本來每個網站爬蟲都不一樣 10/09 15:18
roccqqck22樓都要修改 10/09 15:18
Olwen23樓明明是中文,我確聽不懂 10/09 15:45
PttLite24樓要用眼看 10/09 15:54
ChungLi556625樓看不懂的都沒有成為PM的資質 10/09 16:33
ChungLi556626樓客戶說的備份 要跟工程師說逆向工程才聽得懂 10/09 16:35
wave1et27樓ptt有個allpost版吧 10/09 17:19
PttLite28樓為什麼要對自己的網站做逆向工程 10/09 18:12
RINPE29樓沒有什麼是複製貼上解決不了的 10/09 18:18
sniper282430樓2012做到現在發文發問還像完全不懂程式的外行著實厲害 10/09 19:25
更多請益
[請益] 請問我能得到比現在更好的待遇嗎?
[請益] 如何在履歷表達軟體工程的程度? (C語言)
[請益] 為什麼文組轉職主流是寫code
[請益] 想當資安的職涯規劃
[請益] 是否要再多唸個資工碩
[請益] 醫療軟體與醫療DL職涯與技能走向請益
[請益] 接Offer後還能重新談薪水嗎
[請益]代po 台中 非本科 offer請益