01.技術純真
許多朋友向我傳達了壹個信息:技術是無辜的,技術本身沒有對與錯,但是使用技術的人是對還是錯。如果公司或程序員知道使用其技術是非法的,則公司或個人需要為此付出代價。
在今年頒布了《中華人民***和國網絡安全法》之後,許多以前處於灰色地帶的企業無法開展。
您看不到以前非常流行的各種社會工作者網站。現在大多數人都消失了嗎?因為最新的安全法強調出售超過50條個人信息屬於“嚴重情況”,需要履行其法律責任。
許多草根網站管理員主動關閉了該網站。目前有很多涉及版權信息的網站,如書籍,影視劇,課程等,在後期也將面臨越來越嚴格的審查。
02.哪種爬蟲是非法的?
爬蟲不能是私人的!
如果爬蟲程序收集了諸如公民的姓名,身份證號碼,通訊聯系信息,地址,密碼,財產狀態,軌道等個人信息,並以非法方式使用它,則絕對構成非法獲取信息的行為。公民的個人信息。
就是說,您爬網信息沒有問題,但是不會涉及個人隱私。如果涉及並通過非法手段獲得收益,那麽它必定是非法的。
此外,在以下三種情況下,爬行動物可能是非法的,嚴重的,甚至構成犯罪:
如果爬蟲程序逃避了網站運營商設置的反爬蟲措施或違反了服務器的反捕獲措施以非法獲取相關信息,情節嚴重,則可能構成非法獲取計算機信息數據的犯罪行為。系統。
如果搜尋器程序幹擾了所訪問的網站或系統的正常運行並造成了嚴重後果,則將違反刑法,並構成“破壞計算機信息系統”的罪行。
如果爬蟲收集的信息屬於公民的個人信息,則可能構成非法獲取公民的個人信息的非法行為。如果情況嚴重,可能構成侵犯公民個人信息的罪行。
現在,Internet上有許多付費課程,例如極客時間,知識星球等。如果這些付費內部信息被非法爬網出售並從中獲利,則屬於違法行為。
在遇見網民之前,我搶了各種知識之星的內容,並自行出售。我覺得我找到了壹個巨大的商機。實際上,我不知道這種行為實際上是非常危險的,風險和收益顯然是不平等的。
當我看到這兩天時,他的壹個公***電話號碼被密封了,後來他轉了個喇叭繼續做下去。遲早他被封鎖了。最可憐的是那些購買他的服務的人,因為當他做廣告時,他承諾他永遠也做不到。
03.哪種爬蟲合法?
1.遵守機器人協議
機械手協議,也稱為robots.txt(統壹的小寫字母),是存儲在網站根目錄中的ASCII文本文件。它通常告訴網絡搜索引擎的漫遊者(也稱為網絡蜘蛛),該網站上的哪些內容不應由搜索引擎的漫遊者獲取,而漫遊者可以獲取哪些內容。
漫遊器協議旨在告訴抓取工具哪些信息可以被抓取,哪些信息不能被抓取。嚴格按照漫遊器協議爬網與網站相關的信息通常不會造成太多問題。
2.不要使另壹臺服務器癱瘓
但這並不意味著只要爬蟲遵守機器人協議,就不會有問題。還涉及兩個因素。首先是大型爬網程序無法使另壹端的服務器癱瘓,這相當於網絡攻擊。
在國家互聯網信息辦公室於2019年5月28日發布的數據安全管理措施(征求意見稿)中,建議以行政法規的形式限制爬行動物的使用:
網絡運營商應采用自動方式訪問和收集網站數據,不得妨礙網站的正常運行;此類行為嚴重影響網站的運行,例如自動訪問收集流量超過網站每日平均流量的三分之壹,並且在要求停止自動訪問收集時網站應停止。
3.無非法利潤
惡意使用爬蟲技術來獲取數據,搶占不正當競爭優勢甚至謀取非法利益可能是違法的。實際上,由於非法使用爬蟲技術來捕獲數據而引起的糾紛數量並不大,其中大多數是基於不正當競爭而提起訴訟的。
例如,如果您獲取了公眾評論上的所有公***信息,則您復制了壹個相似的網站並從該網站中獲得了很多利潤。這也是壹個問題。
壹般來說,爬蟲是為企業造福的。因此,爬蟲開發者的道德自力更生和企業管理者的良知對於避免觸及法律底線至關重要。