花了很多P幣,跟時間再研究google跟備份網站
備份網站不是用多線程爬蟲技術嗎?
但是好像發現了,沒有這麼簡單
好像每個版,測試過,被備份的方式不同....
說簡單,但也不簡單
這類網站所依賴的技術,其實滿簡單的
但是PTT只要發文權限跟方式不改,永遠都一定會被備份
發文的那個瞬間,因為很多地方不能改變,只能發文後再改
所以,第一次的文章標題,還有發文者一定會被紀錄
本文可以修改,所以必須等第二次才能解決
想問一下,PTT備份網站,像是PTTWEB 所仰賴的技術.....
謝謝!
損失好多P幣跟時間,血淚,才得到這種結論.....
人腦真的比不上電腦QQ
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.137.62.1 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1633743659.A.19F.html→ gasbomb1樓……有人看得懂這篇嗎? 10/09 10:03
→ yinxuanh2樓伸手文啊 10/09 10:08
→ loadingN3樓為什麼會損失p幣 10/09 10:09
→ Raymond07104樓 10/09 10:14 PttLite5樓看標題進來因為是DB backup或snapshot結果是爬蟲...我快 10/09 11:08
→ PttLite6樓跟不上時代了.. 10/09 11:08
→ qrtt17樓看不懂想要幹麻 10/09 11:55
wahaha2798樓看不懂在說什麼 10/09 11:58
→ yougigun9樓我也跟不上你的腦 10/09 12:02
→ brianhsu10樓請先閱讀「提問的智慧」,謝謝。 10/09 12:09
→ chocopie11樓先定義你要備份的內容是甚麼。 10/09 12:50
→ chocopie12樓是原本的內容一模一樣?還是只爬文章文字內容? 10/09 12:50
→ JimRoid13樓看標題我以為你是要問快照之類的 10/09 12:55
utdsml14樓原 po 應該是想問備份 PTT 裡面所有發推文紀錄的網站 10/09 13:02
→ moom5030215樓ctrl+S…? 10/09 13:05
eduishappy16樓我覺得PTT備份文章的網站真的好厲害喔!全都可以記錄 10/09 13:06
stupid031917樓偷取別人網站內容叫備份¿¿¿ 10/09 13:37
geroge082018樓這就是工程師和客戶之間的思維差異 10/09 13:43
kyoe19樓只要格式固定,都可以被解析 10/09 13:47
flypaper20樓我程度太差看不懂 QQ 10/09 14:31
roccqqck21樓爬蟲作業自己寫欸 本來每個網站爬蟲都不一樣 10/09 15:18
→ roccqqck22樓都要修改 10/09 15:18
→ Olwen23樓明明是中文,我確聽不懂 10/09 15:45
PttLite24樓要用眼看 10/09 15:54
→ ChungLi556625樓看不懂的都沒有成為PM的資質 10/09 16:33
→ ChungLi556626樓客戶說的備份 要跟工程師說逆向工程才聽得懂 10/09 16:35
→ wave1et27樓ptt有個allpost版吧 10/09 17:19
PttLite28樓為什麼要對自己的網站做逆向工程 10/09 18:12
RINPE29樓沒有什麼是複製貼上解決不了的 10/09 18:18
sniper282430樓2012做到現在發文發問還像完全不懂程式的外行著實厲害 10/09 19:25