大家好,今天来为大家解答手机网站备份源码分享这个问题的一些问题点,包括网站备份是什么意思也一样很多人还不知道,因此呢,今天就来为大家分析分析,现在让我们一起来看看吧!如果解决了您的问题,还望您关注下本站哦,谢谢~
1、需求背景:
在百度贴吧上选取一页帖子,点击右键查看源代码,将源代码保存为txt文件,通过python实现从该页面中抓取帖子的标题,作者,时间等信息,将结果保存为excel表格
2、关键技术实现:
python、正则表达式、txt文件读取、excel文件写入
3、代码实现:
importre\nimportcsv\n\nresultList=[]\n34;baidutieba.txt&39;r&34;UTF-8&以下通过正则表达式进行相关的匹配,获取标题,作者,时间等信息\n34;noopener&34;/p/7864139938&34;女高专一发展&34;_blank&34;j_th_tit&39;<arel=&34;href=&34;title=&34;target=&原始文件是:title=&34;\nauthorRE=&34;主题作者:(.*?)&39;\nauthorList=re.findall(authorRE,source,re.S)\n34;pull-rightis_show_create_time&34;创建时间&39;&34;创建时间&39;\ntimeList=re.findall(timeRE,source,re.S)\n\n34;title&34;author&34;time&将文件写入到excel表格里\nwithopen(&39;,&39;,encoding=&39;)asf:\nwriter=csv.DictWriter(f,fieldnames=[&39;,&39;,&39;])\nwriter.writeheader()\nwriter.writerows(resultList)
4、运行代码,查看输出的baidutieba.csv文件,发现虽然能写入正确的内容,但是出现了换行。如下:
5、解决输出多加了空行的方法:
将源代码中:
withopen(&39;,&39;,encoding=&39;)asf:
修改为:
withopen(&39;,&39;,encoding=&39;,newline=&39;)asf:
再次运行,出现的页面如图,空行问题已经解决:
文章到此结束,如果本次分享的手机网站备份源码分享和网站备份是什么意思的问题解决了您的问题,那么我们由衷的感到高兴!