Python 采集87个手绘风格PPT模板
创始人
2024-03-19 10:44:53
0

 源码下载链接:ppt.rar - 蓝奏云

PPT下载链接:https://pan.baidu.com/s/1HUAEe_-4IEV6ttOKC_VPuA?pwd=96px 
提取码:96px

采集的参数

    page_count = 1  # 每个栏目开始业务content="text/html; charset=gb2312"base_url = "https://sc.chinaz.com/"  # 采集的网址  https://sc.chinaz.com/tag_ppt/zhongguofeng.htmlsave_path = "D:\\Sprider\\ChinaZ\\"sprider_count = 110 # 采集数量haved_sprider_count = 0  # 已经采集的数量word_content_list = []folder_name = ""first_column_name = "ppt"sprider_start_count=800 # 从第几个序号开始 直接改数量即可 会做除法操作正 正在采集第32页的第16个资源 debugmax_pager=20 #每页的数量

采集主体代码

def sprider(self, second_column_name):"""采集Coder代码:return:"""if second_column_name == "zhongguofeng":self.folder_name = "中国风"self.first_column_name="tag_ppt"elif second_column_name == "xiaoqingxin":self.folder_name = "小清新"self.first_column_name = "tag_ppt"elif second_column_name == "kejian":self.folder_name = "课件"self.first_column_name = "ppt"merchant = int(self.sprider_start_count) // int(self.max_pager) + 1second_folder_name = str(self.sprider_count) + "个" + self.folder_nameself.save_path = self.save_path+ os.sep + "PPT" + os.sep +  second_folder_nameBaseFrame().debug("开始采集ChinaZPPT...")sprider_url = (self.base_url + "/" +  self.first_column_name + "/" + second_column_name + ".html")response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'UTF-8'soup = BeautifulSoup(response.text, "html5lib")#print(soup)div_list = soup.find('div', attrs={"class": 'ppt-list'})div_list =div_list.find_all('div', attrs={"class": 'item'})#print(div_list)laster_pager_url = soup.find('a', attrs={"class": 'nextpage'})laster_pager_url = laster_pager_url.previous_sibling#89page_end_number = int(laster_pager_url.find('b').string)#print(page_end_number)self.page_count = merchantwhile self.page_count <= int(page_end_number):  # 翻完停止try:if self.page_count == 1:self.sprider_detail(div_list,self.page_count,page_end_number)else:if self.haved_sprider_count == self.sprider_count:BaseFrame().debug("采集到达数量采集停止...")BaseFrame().debug("开始写文章...")self.builder_word(self.folder_name, self.save_path, self.word_content_list)BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")break#https://www.a5xiazai.com/android/youxi/qipaiyouxi/list_913_1.html#https://www.a5xiazai.com/android/youxi/qipaiyouxi/list_913_2.html#next_url = sprider_url + "/list_{0}_{1}.html".format(str(url_index), self.page_count)#  (self.base_url + "/" + first_column_name + "/" + second_column_name + "/"+three_column_name+"")next_url =(self.base_url + "/" +  self.first_column_name + "/" + second_column_name + "_{0}.html").format(self.page_count)# (self.base_url + "/" + self.first_column_name  + "/" + second_column_name + "")+"/list_{0}_{1}.html".format(str(self.url_index), self.page_count)response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'UTF-8'soup = BeautifulSoup(response.text, "html5lib")div_list = soup.find('div', attrs={"class": 'ppt-list'})div_list = div_list.find_all('div', attrs={"class": 'item'})self.sprider_detail(div_list, self.page_count,page_end_number)passexcept Exception as e:print("sprider()执行过程出现错误" + str(e))passself.page_count = self.page_count + 1  # 页码增加1def sprider_detail(self, element_list, page_count,max_page):try:element_length = len(element_list)self.sprider_start_index = int(self.sprider_start_count) % int(self.max_pager)index = self.sprider_start_indexwhile index < element_length:a=element_list[index]if self.haved_sprider_count == self.sprider_count:BaseFrame().debug("采集到达数量采集停止...")breakindex = index + 1sprider_info = "正在采集第" + str(page_count) + "页的第" + str(index) + "个资源"BaseFrame().debug(sprider_info)title_image_obj = a.find('img', attrs={"class": 'lazy'})url_A_obj=a.find('a', attrs={"class": 'name'})next_url = self.base_url+url_A_obj.get("href")coder_title = title_image_obj.get("alt")response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'UTF-8'soup = BeautifulSoup(response.text, "html5lib")#print(next_url)down_load_file_div = soup.find('div', attrs={"class": 'download-url'})if down_load_file_div is None:BaseFrame().debug("需要花钱无法下载因此跳过哦....")continuedown_load_file_url = down_load_file_div.find('a').get("href")#print(down_load_file_url)image_obj = soup.find('div', attrs={"class": "one-img-box"}).find('img')image_src = "https:"+ image_obj.get("data-original")#print(image_src)if (DownLoad(self.save_path).__down_load_file__(down_load_file_url, coder_title, self.folder_name)):DownLoad(self.save_path).down_cover_image__(image_src, coder_title)  # 资源的 封面sprider_content = [coder_title,self.save_path + os.sep + "image" + os.sep + coder_title + ".jpg"]  # 采集成功的记录self.word_content_list.append(sprider_content)  # 增加到最终的数组self.haved_sprider_count = self.haved_sprider_count + 1BaseFrame().debug("已经采集完成第" + str(self.haved_sprider_count) + "个")if (int(page_count) == int(max_page)):self.builder_word(self.folder_name, self.save_path, self.word_content_list)BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")except Exception as e:print("sprider_detail:" + str(e))pass

 采集的文件名

手绘风格乐器素材ppt背景图片


水粉手绘小清新花卉ppt背景图片
水彩手绘绿叶素材ppt背景图片
粉色儿童成长相册ppt背景图片
彩色手绘蔬菜食材ppt背景图片
水彩手绘开学季返校ppt背景图片
新的学期新的起点主题班会ppt模板
绿色渐变水彩风ppt背景模板
彩色卡通健康蔬果ppt图片背景
手绘拼贴画新冠防疫知识ppt背景图
手绘风介绍立秋节气ppt模板
儿童手绘致敬医学工作者ppt背景图片
手绘风幼儿园儿童节PPT课件
黑板手绘风备战高考PPT模板
小清新蓝绿植物文艺风ppt模板
期末家长会PPT模板
大学生职业规划书PPT模板
小学生秋游安全教育PPT模板
活动流程策划案例PPT模板
绿色手绘风叶子开学家长会PPT模板
小学教学工作汇报PPT模板
手绘风学业生涯规划书PPT模板
手绘策划方案答辩PPT模板
手绘绿植毕业生答辩PPT模板
手绘风卡通期中家长会PPT模板
转正述职报告PPT模板
大学生调研报告PPT模板
小清新财务总结报告PPT模板
美妆销售年初总结PPT模板
手绘风旅游旅行PPT模板
销售经理年终总结PPT模板
卡通手绘风2021庆典PPT模板
卡通儿童旅行相册PPT模板
手绘风圣诞节ppt背景
商务时尚企业PPT模板
秋天的图画ppt
小学语文ppt模板
卡通ppt背景图片
ppt模板免费下载
精美ppt模板免费下载
水彩手绘风感恩教师节ppt
手绘风快乐61儿童节PPT模板
文艺趣味手绘风商务总结PPT模板
手绘风医疗医药数据报告PPT模板
创意手绘风动态工作汇报PPT模板
手绘风可爱小班家长会PPT模板
创意手绘电商节活动策划PPT模板
手绘感恩节主题班会PPT模板
手绘清新教学课件PPT模板
绿色手绘花卉植物个人工作总结PPT模板
手绘卡通风端午节习俗PPT模板
手绘风唯美创意三八女神节PPT模板
日系风手绘美丽38女王节PPT模板
清新绿色手绘插画风艺术设计PPT模板
文艺小清新手绘插画风情人节PPT模板
创意粉笔手绘感恩教师节ppt模板
素雅文艺手绘插画师ppt模板
创意可爱手绘风童年回忆ppt模板
个性涂鸦色彩手绘风ppt模板
清新水彩手绘ppt模板
创意卡通铅笔手绘风ppt模板
卡通铅笔手绘大数据整理ppt模板
创意手绘卡通论文答辩ppt模板
创意手绘卡通ppt模板
灰色可爱卡通背景ppt模板
趣味简约手绘线稿ppt模板
创意趣味手绘涂鸦ppt模板下载
创意低碳环保ppt模板
创意彩色手绘论文答辩ppt模板
创意手绘涂鸦褶皱纸张背景ppt模板
创意趣味手绘ppt模板下载
精美彩绘ppt模板下载
水彩手绘说课ppt模板下载
创意手绘ppt卡通动画模板下载
个性创意手绘ppt模板下载
春天气息的ppt模板
化学说课ppt模板下载
玫瑰情人节ppt模板免费下载
手绘涂鸦PPT图表下载
师范类通用ppt模板下载
手绘沙滩海洋生物ppt模板
手绘绿色公园ppt模板下载
手绘梦幻樱花ppt模板下载
手绘女孩ppt模板下载
手绘女孩ppt模板下载
手绘爱心ppt模板下载
粉红女孩ppt模板下载
粉彩美女ppt模板下载

相关内容

热门资讯

中国推进生态环境损害赔偿制度改... 中新社北京12月26日电 (记者 阮煜琳)今年是推进生态环境损害赔偿制度改革十周年。中国生态环境部新...
省内首家!镇江市银行业人民调解... 现场 扬子晚报网12月26日讯(通讯员 余建军 钱璐 记者 万凌云 姜天圣)12月25日上午,镇江市...
爱泼斯坦案涂黑文件仅需复制粘贴... 近日,美国司法部网站公布了爱泼斯坦案文件,其中大量文件内容被涂黑。然而,有消息指出,一些被涂黑的文件...
原创 《... 12月26日,电视剧《剥茧》官宣定档,12月29日起,优酷上线开播。这部电视剧由罗云熙、刘雅瑟等演员...
富安娜理财纠纷背后:中信证券拿... 历时三年,家纺龙头富安娜(002327.SZ)与中信证券(600030.SH)的理财委托纠纷,终于有...
保剑锋方发布律师声明!否认“出... 搜狐娱乐讯 26日,保剑锋转发了工作室发布的律师声明,否认“出轨”“妈宝男”等传闻:“近期,部分网络...
带走82岁南博原院长徐湖平 法... 问道者 | 李 百 领导了南京博物院23年的徐湖平终于在退休17年后被带走了,这个声称“三不原则”的...
沪深联手打造首届跨境商事调解大... 近日,首届“和・界”跨境商事调解大赛决赛在上海北外滩圆满收官。作为国内首个聚焦跨境商事调解领域的创新...
博世科(300422)披露累计... 截至2025年12月26日收盘,博世科(300422)报收于4.63元,较前一交易日下跌1.28%,...
外交部:日本从网络防御政策转向... 12月26日,外交部发言人林剑表示,日本大幅扩建网军,新出台的网络法案和战略名为“主动防御”,实则为...