最近在寫一個爬蟲,需要將網頁進行解析供微信小程序使用。文字和圖片解析都好說,小程序也有對應的text和image標簽可以呈現。而更復雜的,比如表格,則比較棘手,不管是服務端解析還是小程序呈現都很費勁,也很難覆蓋所有情況。于是我想,將表格對應的HTML代碼轉成圖片,不失為一種變通的方法。
這里我們采用node-webshot模塊,它對PhantomJS進行了輕量封裝,可以輕松地將網頁以截圖形式保存下來。
首先安裝Node.js和PhantomJS,然后新建一個js文件,加載node-webshot模塊:
const webshot = require('webshot');
定義選項:
const options = {
// 瀏覽器窗口
screenSize: {
width: 755,
height: 25
},
// 要截圖的頁面文檔區域
shotSize: {
height: 'all'
},
// 網頁類型
siteType: 'html'
};
這里,瀏覽器窗口的寬度要根據網頁情況合理設置,高度可以設置為一個很小的數值,然后頁面文檔區域的高度一定要設置為all,寬度默認為窗口寬度,這樣就可以把表格以最小的尺寸完整截圖。
接下來,定義html字符串:
let html = "target rich text html code, eg: <table>...</table>";
注意,里面的HTML代碼一定要去掉換行符,并將雙引號替換為單引號。
最后,截圖:
webshot(html, 'demo.png', options, (err) => {
if (err)
console.log(`Webshot error: ${err.message}`);
});
這樣,就實現了從HTML代碼到本地圖片的轉換,后續可以上傳到七牛云等。不管是服務端的解析,還是小程序的呈現,都沒有什么難度了...
作者:林諾歐巴,來自原文地址 1.為了讓微信API能夠繞過CAS認證檢查,將微信api入口部分設計為獨立的模塊。放入controller目錄下,命名為wechat。java文件為WechatController.java
文件大體內容如下:
@Controller
@RequestMapping("/wechat")
public class WechatController {
@RequestMapping(value="/dologin")
public void dologin(HttpSession session,HttpServletRequest request, HttpServletResponse response)
...
}
2.因為繞過了CAS認證,為了安全起見,需要在這里做登陸檢查。 大體思路是在dologin成功之后,往session里面寫一個標記,比如寫入用戶名session.setAtribute("username",username); 其他的服務接口在函數開始的時候對session進行檢查,session.get6Attribute("username");如果為空,表明沒有登陸。
3.修改web.xml文件的cas過濾條件。
<filter>
....
<init-param>
<param-name>ignorePattern</param-name>
<param-value>wechat</param-value>
</init-param>
</filter>