我主要既目標係backup晒20年黎蘋果所有板塊既文章。
我會skip晒所有圖同片因為
- 時間唔夠
- 有人backup緊片我就唔一齊啦
- 窮 (因為要用cloud做同埋hosting)
太舊既文章蘋果官網都搵唔到 archive,所以由2002/01/01開始backup,大約有320萬篇文章。
我將所有文字文字內容save上cloud,同埋用database(數據庫)儲存一個可供以後索引嘅目錄。
因為時間嘅關係,同埋佢凌晨已經熄咗Server,所以我琴晚只係大約backup左400,000篇文章。
唔講咁多,睇圖先
Backup左上cloud
其中約300,000篇文章
另外一個backup 渠道,同埋可能同上一張圖有重複,我要再process。
文章索引數據庫
仲有的文未死晒, 而家盡最後努力Backup埋佢
Backup就大家都識, 我將佢用數據庫儲起係希望之後可以做一個索引俾大家公開搜尋搜尋以前嘅內容。但係好可惜我應該Backup唔晒,只可以說我開始得太遲。
以下係比技術同行睇:
DB既內容之後想用 Elasticsearch / Agolia 做indexing,再build一個 frontend 比大家search。另外我都download緊IPFS個的文,睇下之後merge埋一齊搞
P.S. 唔洗起底啦,分身acc黎