这篇文章主要介绍了python爬虫爬取微博评论,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

前几天,杨超越编程大赛火了,大家都在报名参加,而我也是其中的一员。

在我们的项目中,我负责的是数据爬取这块,我主要是把对于杨超越 的每一条评论的相关信息。

数据格式:{“name”:评论人姓名,“comment_time”:评论时间,“comment_info”:评论内容,“comment_url”:评论人的主页}

以上就是我们需要的信息。

————————————————

分享一下我的实操经验:

一,首先是标题:一般在3-30个字之间,切记勿在标题中添加任何联系方式、特殊符号、疑问句、重叠词句等......

建议采用的标题结构:地区+品牌名称+型号+参数特征+修饰用语。

注意:请勿在标题中使用联系人、联系方式、不要使用特殊字符、严禁堆砌关键词!

例:苏州春兰空调不制冷维修 春兰空调加液 保养

二,服务地区:省、市、区县。

三,关键词:一般添加3个就够了。

四,内容正文:

1,严禁内容空短(建议30个字以上),内容应该与标题强相关,是对标题的详细拓展,文不对题,肯定不行。

五,文章发布成功后,及时将文章链接复制粘贴到百度、搜狗、360 搜索引擎进行搜索查看有没有被收录,如果没有被收录要及时把链接做S-E-O优化手动提交给搜索引擎。

六,利用百度指数查询关键词是冷门词还是热门词、冷门词更容易被各搜索引擎抓取收录。

原创文章禁止转载!!!

作者:雷鸣(729098621)

打开网易新闻 查看更多图片