自己挖个坑,准备入手二次修改。
价值1000元的,最近比较热门,本人没什么用,拿来给分享各位。
一键搭建平台,比较智能
下载链接:http://www.johnz.co/html/jishuyuanma/2017/1228/82.html
P2P中DHT网络爬虫
继续挖坑,一个dht网络的“磁力链接”搜索python代码:https://github.com/NanYoMy/DHT-woodworm
这个python代码是用来从DHT网络(一种分布式的“磁力链接”的共享网络,这个叫法是我个人对这种分布式网络的称呼)中,检测收集“磁力链接”。每一个磁力链接就对应着一个种子文件。由于“磁力链接”在DHT网络中是通过分布式共享。所以通过检测DHT网络中的数据包就可以获得其他客户端发来的“磁力链接”,通过这些磁力链接下载相应的种子文件分析获取种子文件的文件资源名,这就完成了整个过程。
继续挖坑,python挖磁链实例。
import requests
import re
from bs4 import BeautifulSoup
url="*种子的网站*/"
header={
"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
"Accept-Encoding":"gzip, deflate",
"Accept-Language":"zh-CN,zh;q=0.8",
"Cache-Control":"max-age=0",
"Connection":"keep-alive",
"Content-Length":"65",
"Content-Type":"application/x-www-form-urlencoded",
"Host":"btkitty.bid",
"Origin":"*种子的网站*",
"Referer":"*种子的网站*/",
"Upgrade-Insecure-Requests":"1",
"User-Agent":"Mozilla/5.0 (Windows NT 10.0.14393; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2950.5 Safari/537.36"
}
while True:
word=input("输入搜索关键词:")
data={
"keyword":word,
"hidden":"true"
}
res=requests.post(url,data=data,headers=header)
bs=BeautifulSoup(res.text,"lxml")
itemInfo=bs.find_all("dd",class_="option")
torrent={}
for item in itemInfo:
magnet=item.find_next("a",href=re.compile("magnet.*")).attrs["href"]
name=item.find_previous("a",href=re.compile("*种子的网站*/.*\.html")).text
size=item.find_next(text=re.compile("\u6587\u4ef6\u5927\u5c0f")).find_next("b").text
time=item.find_next(text=re.compile("\u6536\u5f55\u65f6\u95f4")).find_next("b").text
hot=item.find_next(text=re.compile("\u4eba\u6c14")).find_next("b").text
torrent[name]=[name,time,size,hot,magnet]
for item in torrent:
print("名称:",torrent[item][0])
print("发布时间:",torrent[item][1])
print("大小:",torrent[item][2])
print("热度:",torrent[item][3])
print("磁力链接:",torrent[item][4],'\n')