你放在 LinkedIn 上的资讯失去保护!法院裁定 AI

2020-05-22 作者: 围观:461 46 评论

相信不少在职人士都在用 Linkedin ,这是一个求职或是猎头的好地方,然而把自己的资讯放到网络上,未免还是有一点风险的。早前 HiQ 利用爬虫程式截取 LinkedIn 上面的用家资料,并号称用作 AI 训练用途,后来他们和 Linkedin 闹上法院了,直到今日法官裁定 HiQ 胜诉,他们有权在 Linkedin 上爬资料。

法院裁定 HiQ 有权在 LinkedIn 上爬虫 资料不再安全?

早前一家数据分析公司 HiQ 利用爬虫程式在 LinkedIn 上面爬取用家资料,在五月的时侯 LinkedIn 要求对方内例止行动,并发出了一封公开信,直指对方侵犯平台上的用家,并违反用家条款,甚至违反了 CFAA (Computer Fraud and Abuse Act )

这个事件被一位哈佛法律系教授 Laurence Tribe 关注,而后来在 Jolt Digest 上面裁定这家公司只进行公开资讯的爬虫,并无迹象指他们尝试寻找一些私人的资料,故此指控并不成立。在裁决之后, LinkedIn 决定要上诉,根据 LinkedIn 的发言人所说:「我们对法院的裁决相当失望,但这并不代表完结,我们将会保护在平台上面的所有会员,同时要悍卫他们决定放什幺资讯上 LinkedIn 的权利。」

但很可惜,这些资料是用家决定公开的,对于他们的指控来说并不是很有力的证据。我们再想想,如果我们有足够的人力,也可以在 LinkedIn 上面找到公开的资料,再 Copy & Paste ,HiQ 就是利用爬虫程式去做到这一点,当然我们知道每一个网站都有 robot.txt 去决定是否封截爬虫程式,然而要爬的方法实在太多太多。

事实上,Facebook 在 2010 年曾经向一位工程师提告 内容亦指对方侵犯用户私隐,虽然最后没有闹得很大,但这次事件令我们明白到公开自己的资料,只会让全世界的程式能抓取它,而这是很难的事吗?TechApple 的编辑练习两星期也能用 Python 和 BeautifulSoup 写出爬虫去分析网站了,很难说以后会不会普及。