各类折腾

折腾各种新奇的想法,并记录笔记

各类折腾

爬了3000万QQ用户数据,挖出了花千骨赵丽颖的QQ号

阅读(5850)评论(9)

两周前,做的一个项目需要模拟一批用户评价数据,如果想让数据看着真实点,那就得使用随机的用户昵称和头像啊。要是头像或者昵称全都差不多,那别人一看就看出来这是做的数据了。 于是乎我就写了个从我QQ空间开始的蜘蛛网式的爬虫程序,程序断断续续的运行了两周。总共爬到了腾讯3000万QQ数据,其中有300万包含用户(QQ号,昵称,空间名称,会员级别,头...

各类折腾

实验室-QQ群关系可视化关系图2

阅读(9256)评论(5)

网站负载较重,有时可能会查询超时 算法并不是最有效率,所有速度比较慢 查询完后刷新后才能进行第二次查询 4.20 完成了可视化图,人脉网络 下个版本会优化算法并添加自动搜寻人脉网等功能 此源码会在合适的时候开源 ...

各类折腾

实验室-QQ群关系可视化关系图

阅读(6339)评论(2)

4.20更新:可视化数据已经完成,正在后端数据制作 切勿用于非法用途,本QQ群关系主要用于学习交流目的, 目前想法是把QQ群关系的可视化关系图表现出来,目前还没有实现。 = - 只完成了第一阶段,后续还会开发 大家可以玩玩 地址:https://x.hacking8.com/29.html ...

鄂ICP备18025574号 RSS订阅

Powered by emlog © Emlog大前端 theme By 小草窝 SiteMap