#__author:'cuiwnehao'__
#coding:utf-8
from bs4 import BeautifulSoup
import requests
url='http://scitech.people.com.cn'
req=requests.get(url)
req.encoding="GB2312"
html=req.text
soup=BeautifulSoup(html,'lxml')
h2_result=soup.find('h2',class_='qiehuan1 mt15')
#print(len(h2_result))
biaotis=h2_result.find_all('i')
#print(len(biaotis))
biaoti_list=[]
for biaot in biaotis:
biaoti=biaot.text.split()[1]
#print(biaoti)
biaoti_list.append(biaoti)
print(biaoti_list)
cibiaoti=soup.find_all('div',class_='headingNews qiehuan1_c')[0]
#print(cibiaoti)
h5_result=cibiaoti.find_all('h5')
#print(len(h5_result))
on=cibiaoti.find_all('div',class_='on')
h5_list=[]
for h5 in h5_result:
h5_biaoti=h5.text
#print(h5_biaoti)
h5_list.append(h5_biaoti)
h5_a=h5.find('a') #在a标签下找到【'href'】在h5下是找不到的
#print(h5_a)
h5_url=h5_a['href']
#print(h5_url)
cibiaoti_url=url+h5_url
print(h5_biaoti,cibiaoti_url)
for jie in on:
jieguo=jie.text
print(jieguo)
【Python爬虫】人民日报科技
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 第一步,查看要爬取的网站:https://book.douban.com/subject/26952485/col...