在用node.js做爬虫的时候,遇到了网页charset是gbk2312的,然后爬下来的中文全部乱码了,这时候,怎么解决呢?
贴上代码:
//解决gbk2312中文乱码问题
http.get(url,function(res){
var arrBuf = [];
var bufLength = 0;
res.on("data", function(chunk){
arrBuf.push(chunk);
bufLength += chunk.length;
})
res.on("data", function(chunk){
arrBuf.push(chunk);
bufLength += chunk.length;
})
.on("end", function(){
var chunkAll = Buffer.concat(arrBuf, bufLength);
var strJson = iconv.decode(chunkAll,'gb2312'); // 汉字不乱码
console.log(strJson);
});
});
这样解决就可以啦