[半自動] Backup 昔日蘋果日報

3KG毒后高_可_晴

747 回覆
895 Like 14 Dislike
3KG毒后高_可_晴 2021-06-22 15:02:55
Chrome既plugin做,
Link Grabber
Save Page WE

加一個小program:
Auto Click

Save做 HTML
大約10分鐘back 一日既所有版面
可惜動新聞 back唔到
唔係IT人,所以只可以做到半自動,IT高手唔好屌咁大力
有人有興起既可以一齊做
具現化系 2021-06-22 15:03:53
推!
3KG毒后高_可_晴 2021-06-22 15:11:47
一日既backup大約200MB
媽咪 2021-06-22 15:22:01
wget?
3KG毒后高_可_晴 2021-06-22 15:30:17
有睇過wget,不過唔識搞蘋果user login既問題
大毒梟高可晴 2021-06-22 16:11:19
@斯羅@ 2021-06-22 16:17:24
逐日嚟要搞幾耐
不寫程式的程式員 2021-06-22 16:22:08
我見archive.org有基本backup, 但唔清楚有幾齊
有無得閒既人去研究下

https://web.archive.org/web/*/https://hk.appledaily.com/
3KG毒后高_可_晴 2021-06-22 16:23:32
backup一個月既所有頁面(約5000頁),大約60分鐘
做慢既,不過我諗好過乜都唔做
3KG毒后高_可_晴 2021-06-22 16:25:38
2017之前無backup喎,咁我可以由2017年10月BACKWARD 做
不寫程式的程式員 2021-06-22 16:31:23
唔能夠咁講,
個時間係archive.org隻crawl爬文既時間

我隨便click落賽馬已經炒左
https://web.archive.org/web/20210618031533mp_/https://hk.appledaily.com/racing/20210617/RQBU6UDHIBFVZDFYK4XUIXZEYA/
3KG毒后高_可_晴 2021-06-22 17:28:30
明白,如果有人幫手做,就會快好多
剛果臘腸 2021-06-22 17:47:24
幫手backup +1
逢甲牧屍人 2021-06-22 17:51:40
應該先 backup 獨家新聞


壹週刊都有好多獨家報道

BTW 果籽d片都好高質
3KG毒后高_可_晴 2021-06-22 17:55:17
謝謝

可以裝咗上面既program先
同你有subscribe 蘋果
不過save完既網頁就不會見到user id的(都好,第時share都唔會私隱問題)
3KG毒后高_可_晴 2021-06-22 17:57:48
要選獨家新聞出黎,要時間,除非有人整好web link唔就容易搞

果籽我都好中意,我諗有其他巴絲打做緊backup
地獄紅寶書 2021-06-22 18:29:31
3KG毒后高_可_晴 2021-06-22 18:38:37
如果用我既(不完善)既方法,可以先有人extract links ,再有人download

最不濟係download時,架電腦會做唔到其他野
剛果臘腸 2021-06-22 18:40:31
如果backup youtube片用呢個方法最快,接近full auto
https://lihkg.com/thread/2578261/page/1

我諗最需要係有張spreadsheet做indexing,有無人知有咩anonymous 既online spreadsheet可以collaborate既?
3KG毒后高_可_晴 2021-06-22 18:58:11
不如係度sharelinks 就OK?
360度轉變 2021-06-22 19:30:26
呢個印象中如果蘋果個sever 無咗/轉過server
Wayback machine都會無埋
麻楝 2021-06-22 20:11:34
3KG毒后高_可_晴 2021-06-22 20:28:17
Copy 蘋果網頁方法:
1. 去蘋果網頁,選擇昔日,選擇一日
2. 用 Link Grabber (Chrome Plugin) ,去解釋蘋果網頁
會得到網頁如下:
https://hk.appledaily.com/local/20170101/7KIPVYZFGLGZI64H6DXLY2ILPQ/
分析網頁會有:
日期: 20170101
分類: local , entertainment, China, special, columnist......
copy 有用既網頁 (如上面藍色的link),save做 text file (例如.20170101.txt)
一日約有150- 180條links
3. Save Page WE
用 Save Page WE (Chrome Plugin) 去開 20170101.txt
Save 第一條link去一個folder
4. 開 Auto click,(https://www.opautoclicker.com/) 去click save 之後的file
大約5秒會load and save 到一個file.

Sorry 1999 ,唔明請出聲
LemonTea2018 2021-06-22 20:31:01
archive.org 唔係太穩陣, 隨時可能冇左
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞