python如何爬取微信好友信息?(下)
Python3爬蟲代碼怎么抓取微信好友基本信息,并且進行數(shù)據(jù)清洗,上篇已經(jīng)將教程的上半部分進行了分解,下面我們繼續(xù)來解決這個問題,將接下來的兩個步驟完成。
4、利用簽名繪制詞云
#4、繪制詞云
#4.1 替換簽名中的emoji、span、class、類似<>/= 之類的符號等等
siglist = []
for i in friends:
signature = i["Signature"].strip().replace("span","").replace("class","").replace("emoji","")
rep = re.compile("1fd+w*|[<>/=]")
signature = rep.sub("", signature)
siglist.append(signature)
text = "".join(siglist)
#4.2 把結(jié)巴分詞這個包搞進來分詞
import jieba
wordlist = jieba.cut(text, cut_all=True)
word_space_split = " ".join(wordlist)
#4.3 進入畫圖階段,根據(jù)自己想要的圖片、形狀、顏色畫出相似的圖形
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
import numpy as np
import PIL.Image as Image
coloring = np.array(Image.open("101.jpg"))
my_wordcloud = WordCloud(background_color="white", max_words=2000,
mask=coloring, max_font_size=60, random_state=42, scale=2,
font_path="STXINWEI.TTF").generate(word_space_split)
image_colors = ImageColorGenerator(coloring)
plt.imshow(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()
5、ggplot圖形展示
#5、ggplot圖形展示
import matplotlib.pyplot as plt
#獲取csv內(nèi)容
df = pd.read_csv('data.csv')
#配置圖
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(df['Sex'], bins=7)
#標題
plt.title('Sex distribution')
#X軸標題
plt.xlabel('Sex')
#Y軸標題plt.ylabel('people')
plt.show()
以上當這些步驟執(zhí)行完之后,我們就能夠?qū)⑽⑿藕糜训幕拘畔⒆ト⊥戤吜恕?/span>