浙江龙网

「路在何方」网络安全与数据合规|爬虫合规,路在何方

『龙网 ▪ 联盟摘要_「路在何方」网络安全与数据合规|爬虫合规,路在何方』今朝国内数据相干立法较为分散,但工信部等部分对于企业的数据安然及小我信息保护却日益看重,企业须要尽快针对爬虫等技巧进行合规,充分厘清司法界线,防止企业陷入司法胶葛...


数据作为一种新型资源,不仅价值正在被重新评估,而且正作为新类型的法益被法律所保护。公司为了保证数据运算的准确性,通常会采取各种方式搜集大量数据。而垂直搜索、爬虫等从互联网上获取数据的方式,不仅可以获取大量的数据而且成本低廉,是众多公司必备的获取数据的方式。目前,数据安全问题也成为国内外重点监管的问题。字节跳动旗下的TIKTOK的海外业务正因数据安全问题而受到重重阻挠,美国和欧盟的数据传输协议也刚刚被欧盟法院裁定无效;国内,抖音和微信读书上周刚被北京法院认定侵犯用户个人信息权益。
摘要
【 「路在何方」网络安全与数据合规|爬虫合规,路在何方】目前国内数据相关立法较为分散,但工信部等部门对于企业的数据安全及个人信息保护却日益重视,企业需要尽快针对爬虫等技术进行合规,充分厘清法律界限,防止企业陷入法律纠纷。本文将对爬虫技术进行简要介绍及定性,重点列明目前法律规定以及实务中出现的合规要点,以保证企业可以有针对性的建立爬虫技术合规体系。
一、爬虫概述
爬虫,是按照一定的规则,可自动、批量地抓取互联网信息的程序或者脚本。其可分为通用爬虫和专用爬虫等,在此我们不做过多讨论。
我们应该明确爬虫的性质,爬虫本身只是一种技术,是大数据时代下电商、社交等公司获取数据的常规手段,我们大可不必”谈虫色变”。在技术中立的原则下,如何在合规体系内使用爬虫技术,才是我们要考虑的重点。
二、爬虫合规要点列明
(一)防止对被爬取方造成影响
1、遵守被爬网站的robots协议
网站一般会设置robots协议,告诉网络爬虫哪些数据可以爬取,哪些数据不可以爬取。在使用爬虫技术时要遵循被爬网站的robots协议,避免出现不正当竞争等违法情形。
2、不得妨碍被爬虫网站的正常运行
爬虫行为等自动化收集信息等行为,无疑会增加网站的运行负担。最接近我们生活实例的就是12306铁路购票网站,通常会被各种抢票软件爬取信息而导致运行难度大,造成用户无法正常购票。
而我国对于此的规定只有《数据安全管理办法(征求意见稿)》第十六条,网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。“三分之一”的比例是否合理我们暂且放置。此法条第二款应为第一款的非穷尽列举之一,其他妨碍网站正常运行的方式还需我们在实践中探索。如,大量搜集同类型的网站数据,导致网站核心模式被复制,网站被引流等,会导致企业间的不正当竞争。


上一篇:【公司在京东】网店虚构交易量近四成夫妻双双被罚20万

下一篇:【公司】软件革命,丰田正式成立新公司

科技

【公司】软件革命,丰田正式成立新公司

阅读(47)

大年夜众甚至多次公开表示,软件程度落后特斯拉十年。众所周知,大年夜众ID.3和新款高尔夫在软件问题上都出现了问题,导致CEO一度被工会炮轰。 丰田的目标也类似,欲望在硬件制造...

生活

开车也要去吃的这间大排档,集美也有分店了

阅读(22)

浙江龙网提示您,本文原题为 -- 开车也要去吃的这间大排档 , 集美也有分店了 说到厦门大排档 , 每个区域都有着独特的一家 。 在前埔的舒味海鲜大排档 , 就是在前埔区非常火爆的...

生活

5万开出10万面子的SUV都在这 准备把哪款带回家

阅读(47)

宝骏510是上汽通用五菱旗下一款定位于城市的小型SUV车型,车型主打年轻态的设计理念,在外观设计方面和以往的宝骏车型有着很大的不同,分体式大灯和悬浮车顶的设计使宝骏510看起...

生活

吃鸡不见鸡,这种串串真高级!

阅读(26)

浙江龙网提示您,本文原题为 -- 吃鸡不见鸡 , 这种串串真高级! 南北各地 , 以“串串”形式走红的小吃不计其数 , 在四川乐山 , 当地最有名的串串美食 , 当属钵钵鸡 。 包罗万...