- A+
所属分类:软件应用
python相对于php来说,我更喜欢python一些,接触虽然没有多长时间,但是却在很多方面都能够帮到我。而php接触的时间不短,而且在工作中也遇到不少,但是却依旧茫然中。
python经常用到的,或许就是抓取了,毕竟是做SEO的,很多数据需要抓取分析,写程序过程中会用到正则表达式,正则可是非常让人头疼的,一不注意,就获取不到数据。
在各类网页中,很多页面是经过处理的,比如新浪微博,搜索结果源码全部经过了处理。正则处理过程中,遇到了反斜杠"\",在正则表达式中有反斜杠,最终数据就是空的。后来查过资料才发现,问题出在"\"上面。
在正则表达式中,反斜杠"\"的处理可以在前面再加上四个"\",也就是说,正则表达式中,如果有一个"\",就需要共输入五个\。之后查看就OK了。