在本地測試了一下采集器,目前的邏輯是
采集后直接添加到了數據庫,這樣采集的內容都會占用了ID,數據發布不一定按最新的發布。
這時候會導致,發布時間跟采集的內容產生一個矛盾。
如:2021年1月31日 采集了100篇文章。 選擇性發布了2篇
ID99的文章發布時間 2021年1月31日 00:46:52
ID10的文章發布時間 2021年2月1日 14:47:16
ID 大的,發布時間排序反而是昨天。
建議采集到的數據,不要直接入庫,先建立一個臨時數據庫,需要的時候在導入到數據庫中,這樣還可以做到真正意義的定時發布。