貝索斯技術員編寫種純自動化爬蟲腳本。
互聯網時代,切講究效率速度,但時候,單純效率會催巨隱患。
任何網站負載都限,如果個網站登陸訪問請求超過某個限值,比如秒鍾幾萬次登陸請求,麽個網站都會宕機,數據量再加話,務器甚至能燒。
而客最常用攻擊方式,就寫個自動化登陸腳本斷請求登陸。
為防客,些程序員佬發種驗證機辦法——驗證碼!
沒錯,最討厭驗證碼,其實為防客!
因為驗證碼動態變化,每次都樣,客編寫純自動化腳本沒辦法識別。
貝索斯技術團隊開發這種純自動化爬蟲腳本,就類似於客種腳本。
以到秒鍾采集萬次數據!
而掏寶務器能夠承載千萬同時線流量“怪物”,這點數據采集數量,根本會引起掏寶懷疑。
秒鍾萬次,貝索斯甚至以半時內把淘寶網所頁面數據全部采集完!
到淩晨點時候。
喬恩興奮到圈發貝索斯,激動:“boss,們爬蟲已經開始爬數據,爬完數據後,技術團隊會把數據傳到咱們自己數據庫!”
“嘿嘿,陳默肯定,掏寶斥巨資辛辛苦苦搞數千萬賣頁面數據,咱們爬蟲爬半個時就能爬完。這給咱們省筆錢呢!”
貝索斯刻起,開:“nice!告訴技術團隊,這件事搞定以後,給們發獎!”
頓頓,貝索斯又:“對,ip定勤換著點,爬完數據之,千萬別被對方程序牛給逮到!”
喬恩刻點點頭:“好!這就吩咐!”
自動更換ip功能很好,甚至現成軟件,需技術員現場編寫,直接載個拿過來用就。
點分,貝索斯爬蟲正式動對掏寶頁面數據進量采集。
此刻,馬福報正掏寶親自鎮加班。
雖然反作弊功能印logo功能都以自動開啟。
但為能竊取樂掏部分流量,馬福報讓技術員暫時關閉這倆功能,聽從指揮。
隻馬福報聲令,這兩個功能就能瞬間開啟,把所被爬蟲爬數據變成髒數據!
當樂掏爬蟲開始肆無忌憚采集掏寶數據時,掏寶技術員就發現異常!
“馬總,對方動!而且爬蟲速度非常,用半時就能爬咱們全部數據!”
技術總監說。
Copyright © Fantitxt小說 All rights reserved.新筆趣閣網站地圖