您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

Python爬蟲eval混淆，爬蟲進階實戰系列

編輯：Python

文章目錄

- ️ 前置知識
- ️ 電視貓實戰場景
- ️ 實戰編碼

️ 前置知識

曆經 10 篇左右的 Python 字體反爬系列文章，我們又進入了一個新的主題，常見混淆加密原理與實踐。

本篇博客從 eval 混淆開始，逐層為大家拆解 JS 逆向中混淆相關知識。

eval 函數可以將 JS 字符串解析成源碼執行

在搜索引擎隨機選擇可進行加密 JS 代碼的頁面，然後加密下述內容。

加密前

var name = "橡皮擦";

加密後

eval(
(function (p, a, c, k, e, d) {

e = function (c) {

return (
(c < a ? "" : e(parseInt(c / a))) +
((c = c % a) > 35 ? String.fromCharCode(c + 29) : c.toString(36))
);
};
if (!"".replace(/^/, String)) {

while (c--) d[e(c)] = k[c] || e(c);
k = [
function (e) {

return d[e];
},
];
e = function () {

return "\\w+";
};
c = 1;
}
while (c--)
if (k[c]) p = p.replace(new RegExp("\\b" + e(c) + "\\b", "g"), k[c]);
return p;
})('1 0 = "橡皮擦"', 62, 2, "name|var".split("|"), 0, {
})
);

可以看到加密之後的代碼變得更加複雜，並且可讀性變弱。

在 JS 中，eval 函數本身就是一個 JS 代碼執行器，它可以將傳入的字符串按照 JS 語法進行解析並執行。

解密 eval 函數的方式比較簡單，直接找工具。

該形式代碼最常見的場景就是百度的統計代碼，具體案例你可以尋找一下。

本次我們要采集的站點是電視貓，目標地址為：https://www.tvmao.com/program/BTV1。

在該頁面點擊更多之後，會加載節目列錶數據，得到的接口與參數如下所示。

請求網址: https://www.tvmao.com/api/pg?p=加密字符串
請求形式：GET

通過查看更多，我們可以抓取到數據請求比特置。

️ 電視貓實戰場景

伴隨斷點，我們進入到 JS 逆向環節，得到的第一段代碼如下所示。

$(".more-epg").click(function () {

var b = "src";
var a = A.d("a", b);
ajaxVerify(
"/api/pg",
"GET",
{

p: a,
},
function (c, d) {

$("#noon").after(d[1]);
$(".more-epg").remove();
}
);
});

代碼中比較核心的是 A.d("a", b) ，其中函數 d() 可能是加密環節。

接下來就是重點內容了，我們並沒有找到加密函數所在的 JS 文件，該 JS 代碼段是臨時的，或者稱為匿名的。