日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

基于Apify+node+react/vue搭建一個有點意思的爬蟲平臺

來源: 責編: 時間:2024-07-22 07:14:00 601觀看
導讀前言熟悉我的朋友可能會知道,我一向是不寫熱點的。為什么不寫呢?是因為我不關注熱點嗎?其實也不是。有些事件我還是很關注的,也確實有不少想法和觀點。但我一直奉行一個原則,就是:要做有生命力的內容。本文介紹的內容來自于

前言

熟悉我的朋友可能會知道,我一向是不寫熱點的。為什么不寫呢?是因為我不關注熱點嗎?其實也不是。有些事件我還是很關注的,也確實有不少想法和觀點。但我一直奉行一個原則,就是:要做有生命力的內容XWp28資訊網——每日最新資訊28at.com

本文介紹的內容來自于筆者之前負責研發的爬蟲管理平臺, 專門抽象出了一個相對獨立的功能模塊為大家講解如何使用nodejs開發專屬于自己的爬蟲平臺.文章涵蓋的知識點比較多,包含nodejs爬蟲框架父子進程及其通信reactumi等知識, 筆者會以盡可能簡單的語言向大家一一介紹。XWp28資訊網——每日最新資訊28at.com

你將收獲

  • Apify框架介紹和基本使用
  • 如何創建父子進程以及父子進程通信
  • 使用javascript手動實現控制爬蟲最大并發數
  • 截取整個網頁圖片的實現方案
  • nodejs第三方庫和模塊的使用
  • 使用umi3 + antd4.0搭建爬蟲前臺界面

平臺預覽

爬蟲代碼的其他部分因為不是核心重點,這里不一一舉例, 我已經放到github上,大家可以交流研究.XWp28資訊網——每日最新資訊28at.com

有關如何提取網頁文本, 也有現成的api可以調用, 大家可以選擇適合自己業務的api去應用,筆者這里拿puppeteerpage.$eval來舉例:XWp28資訊網——每日最新資訊28at.com

const txt = await page.$eval('body', el => {    // el即為dom節點, 可以對body的子節點進行提取,分析    return {...}})復制代碼

nodejs第三方庫和模塊的使用

為了搭建完整的node服務平臺,筆者采用了XWp28資訊網——每日最新資訊28at.com

  • koa 一款輕量級可擴展node框架
  • glob 使用強大的正則匹配模式遍歷文件
  • koa2-cors 處理訪問跨域問題
  • koa-static 創建靜態服務目錄
  • koa-body 獲取請求體數據 有關如何使用這些模塊實現一個完整的服務端應用, 筆者在代碼里做了詳細的說明, 這里就不一一討論了. 具體代碼如下:
const Koa  = require('koa');const { resolve } = require('path');const staticServer = require('koa-static');const koaBody = require('koa-body');const cors = require('koa2-cors');const logger = require('koa-logger');const glob = require('glob');const { fork } = require('child_process');const app = new Koa();// 創建靜態目錄app.use(staticServer(resolve(__dirname, './static')));app.use(staticServer(resolve(__dirname, './db')));app.use(koaBody());app.use(logger());const config = {  imgPath: resolve('./', 'static'),  txtPath: resolve('./', 'db')}// 設置跨域app.use(cors({  origin: function (ctx) {      if (ctx.url.indexOf('fetch') > -1) {        return '*'; // 允許來自所有域名請求      }      return ''; // 這樣就能只允許 http://localhost 這個域名的請求了  },  exposeHeaders: ['WWW-Authenticate', 'Server-Authorization'],  maxAge: 5,  //  該字段可選,用來指定本次預檢請求的有效期,單位為秒  credentials: true,  allowMethods: ['GET', 'POST', 'PUT', 'DELETE'],  allowHeaders: ['Content-Type', 'Authorization', 'Accept', 'x-requested-with'],}))// 創建異步線程function createPromisefork(childUrl, data) {  const res = fork(childUrl)    data && res.send(data)    return new Promise(reslove => {      res.on('message', f => {        reslove(f)      })    })}app.use(async (ctx, next) => {  if(ctx.url === '/fetch') {    const data = ctx.request.body;    const res = await createPromisefork('./child.js', data)    // 獲取文件路徑    const txtUrls = [];    let reg = /.*?(/d+)/./w*$/;    glob.sync(`${config.txtPath}/*.*`).forEach(item => {      if(reg.test(item)) {        txtUrls.push(item.replace(reg, '$1'))      }    })    ctx.body = {      state: res,      data: txtUrls,      msg: res ? '抓取完成' : '抓取失敗,原因可能是非法的url或者請求超時或者服務器內部錯誤'    }  }  await next()})app.listen(80)復制代碼

使用umi3 + antd4.0搭建爬蟲前臺界面

該爬蟲平臺的前端界面筆者采用umi3+antd4.0開發, 因為antd4.0相比之前版本確實體積和性能都提高了不少, 對于組件來說也做了更合理的拆分. 因為前端頁面實現比較簡單,整個前端代碼使用hooks寫不到200行,這里就不一一介紹了.大家可以在筆者的github上學習研究.XWp28資訊網——每日最新資訊28at.com

  • github項目地址: 基于Apify+node+react搭建的有點意思的爬蟲平臺

界面如下:XWp28資訊網——每日最新資訊28at.com

圖片XWp28資訊網——每日最新資訊28at.com

大家可以自己克隆本地運行, 也可以基于此開發屬于自己的爬蟲應用.XWp28資訊網——每日最新資訊28at.com

項目使用的技術文檔地址

  • apify 一款用于JavaScript的可伸縮的web爬蟲庫
  • Puppeteer
  • koa -- 基于nodejs平臺的下一代web開發框架

本文鏈接:http://m.www897cc.com/showinfo-26-102776-0.html基于Apify+node+react/vue搭建一個有點意思的爬蟲平臺

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 2024年新的原生嵌套CSS特性:絕對改變游戲規則

下一篇: 代碼水平暴增!掌握這五個JavaScript神技,讓你成為團隊最靚的仔

標簽:
  • 熱門焦點
  • 一篇聊聊Go錯誤封裝機制

    %w 是用于錯誤包裝(Error Wrapping)的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數中的一個特殊格式化動詞,用于將一個錯誤(或其他可打印的值)包裝在一個新的錯誤中。使
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人員可能會涉及各種各樣的安全任務,包括但不限于:開發某些安全工具的插件,滿足自己特定的安全需求;自定義github搜索工具,快速查找所需的安全資料、漏洞poc、exp
  • 2天漲粉255萬,又一賽道在抖音爆火

    來源:運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期,旅游賽道徹底火了:有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億;有的「博主」火了&m
  • 一條抖音4億人圍觀 ! 這家MCN比無憂傳媒還野

    作者:Hiu 來源:互聯網品牌官01 擦邊少女空降熱搜,幕后推手曝光被網友譽為“純欲天花板”的女網紅井川里予,近期因為一組哥特風照片登上熱搜,引發了一場互聯網世界關于
  • 東方甄選單飛:有些鳥注定是關不住的

    作者:彭寬鴻來源:華爾街科技眼‍‍‍‍‍‍‍‍‍‍東方甄選創始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一
  • 疑似小米14外觀設計圖曝光:后置相機模組變化不大

    下半年的大幕已經開啟,而誰將成為下半年手機圈的主角就成為了大家關注的焦點,其中被傳有望拿下新一代驍龍8 Gen3旗艦芯片的小米14系列更是備受大家矚
  • iQOO 11S新品發布會

    iQOO將在7月4日19:00舉行新品發布會,推出杭州亞運會電競賽事官方用機iQOO 11S。
  • 2299元起!iQOO Pad明晚首銷:性能最強天璣平板

    5月23日,iQOO如期舉行了新品發布會,除了首發安卓最強旗艦處理器的iQOO Neo8系列新機外,還在發布會上推出了旗下首款平板電腦——iQOO Pad,其最大的賣點
  • onebot M24巧系列一體機采用輕薄機身設計,現已在各平臺開售

    onebot M24 巧系列一體機目前已在線上線下各平臺同步開售。onebot M24 巧系列采用一體化輕薄機身設計,最薄處為 10.15mm,擁有寶石紅、午夜藍、石墨綠、雅致
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产亚洲欧美一区二区三区| 久久综合狠狠| 亚洲在线一区二区| 国产婷婷色一区二区三区| 欧美日韩国产美女| 久久免费视频在线观看| 狠狠色丁香久久婷婷综合丁香 | 欧美国产第二页| 久久精品一本久久99精品| 一本色道88久久加勒比精品| 136国产福利精品导航网址应用 | 欧美大片免费观看| 久久偷窥视频| 欧美日本免费| 欧美日韩国产成人高清视频| 国产精品嫩草99a| 欧美私人啪啪vps| 欧美片第一页| 国产麻豆视频精品| 国产欧美一区二区精品忘忧草| 国产精品你懂的在线欣赏| 激情亚洲一区二区三区四区| 国产欧美日韩不卡| 91久久久久久| 国产婷婷色一区二区三区| 亚洲激情视频| 欧美一二三区在线观看| 在线亚洲+欧美+日本专区| 亚洲精品久久| 亚洲精品欧美日韩专区| 亚洲欧美日韩精品久久久| 欧美一区二区视频在线观看| 欧美一区2区三区4区公司二百| 免费视频最近日韩| 免费视频一区二区三区在线观看| 国产精品久久久久久久电影| 欧美日韩亚洲三区| 亚洲一级黄色片| 欧美日韩一区二区免费在线观看| 亚洲一区二区三区四区五区午夜| 夜夜嗨av一区二区三区网站四季av| 欧美影院成年免费版| 欧美中文字幕精品| 欧美日韩精品免费观看视频完整| 伊人成人网在线看| 最新亚洲电影| 日韩视频在线观看一区二区| 亚洲精品一区中文| 亚洲先锋成人| 亚洲一区二区精品在线| 欧美风情在线观看| 国内精品久久久久久影视8| 黄色成人av网| 亚洲精品小视频在线观看| 欧美在线国产| 国产精品久久久久久久久久免费看| 欧美视频免费在线| 国产视频在线一区二区| 激情综合自拍| 亚洲人成毛片在线播放| 日韩图片一区| 亚洲综合视频一区| 久久精品国产精品亚洲精品| 欧美色综合天天久久综合精品| 国产精品美女主播| 国产精品三级视频| 国内精品久久久久久久影视蜜臀 | 欧美在线观看一二区| 欧美午夜视频网站| 激情综合亚洲| 99在线|亚洲一区二区| 亚洲自拍偷拍色片视频| 欧美一级大片在线观看| 久久一区二区三区超碰国产精品| 国产精一区二区三区| 亚洲自拍偷拍视频| 国产精品黄色| 亚洲性夜色噜噜噜7777| 最新日韩在线| 亚洲欧美中文日韩v在线观看| 美女黄网久久| 欧美网站大全在线观看| 一区二区三区日韩欧美精品| 久久国产欧美精品| 欧美日韩国产另类不卡| aⅴ色国产欧美| 香蕉久久国产| 国产日韩av在线播放| 亚洲三级网站| 欧美激情精品久久久| 国产视频久久久久久久| 亚洲精品极品| 久久国产夜色精品鲁鲁99| 国产亚洲一区在线| 久久久久久久久久码影片| 欧美激情一区二区三区| 国产精品久久久久久久久| 亚洲综合国产| 国产午夜精品全部视频在线播放 | 亚洲影院色在线观看免费| 国产精品久久久久久久9999 | 香港久久久电影| 欧美日韩亚洲精品内裤| 一区二区欧美亚洲| 国产精品日韩精品| 亚洲日本激情| 欧美日韩天天操| 亚洲欧美日韩高清| 国产一区二区三区精品欧美日韩一区二区三区| 久久国产欧美| 亚洲欧洲精品一区二区| 欧美日韩国产黄| 亚洲精品久久视频| 久久综合九色综合久99| 91久久久久| 国产精品v欧美精品v日本精品动漫| 亚洲乱码视频| 欧美成人午夜激情在线| 尤物yw午夜国产精品视频| 午夜精品免费| 激情综合久久| 欧美日韩二区三区| 亚洲综合成人婷婷小说| 韩国美女久久| 久久久久国产一区二区三区| 欧美视频第二页| 欧美一区二区三区在线观看| 亚洲成人在线观看视频| 久久久欧美精品sm网站| 国产一区二区三区久久久| 亚洲欧美欧美一区二区三区| 国产一区二区观看| 欧美成人免费观看| 亚洲校园激情| 樱桃视频在线观看一区| 欧美网站在线观看| 久久综合狠狠综合久久激情| 国模精品一区二区三区| 欧美电影在线播放| 亚洲激情综合| 国产欧美日韩伦理| 欧美一区二区私人影院日本 | 香港成人在线视频| 国产精品久久久久久福利一牛影视 | 国产精品电影观看| 亚洲欧美一区二区三区在线 | 欧美一级在线播放| 亚洲日本中文字幕免费在线不卡| 国产精品视频不卡| 欧美在线网址| 99re热精品| 国产综合色产在线精品| 欧美日韩综合视频| 亚洲一区在线免费观看| 亚洲第一福利在线观看| 久久亚洲国产精品日日av夜夜| 日韩一区二区高清| 亚洲狼人综合| 国产视频在线观看一区二区三区 | 国产精品久久久久久妇女6080| 欧美91大片| 国产乱肥老妇国产一区二 | 欧美日韩国产首页在线观看| 久久香蕉国产线看观看网| 亚洲激情网站免费观看| 国产欧美日韩综合| 欧美久久婷婷综合色| 久久精品国产久精国产一老狼| 在线播放精品| 国产精品亚洲片夜色在线| 欧美精品日本| 亚洲欧美激情在线视频| 亚洲精品欧美极品| 一区二区三区在线视频观看| 国产精品有限公司| 欧美日韩在线不卡| 欧美高潮视频| 免费亚洲一区二区| 亚洲天堂av综合网| 国产亚洲欧美另类中文| 欧美三级韩国三级日本三斤| 欧美国产免费| 亚洲免费网站| 一区二区三区四区国产精品| 国产午夜精品全部视频播放| 国产精品成人免费精品自在线观看| 欧美二区乱c少妇| 久久综合久色欧美综合狠狠| 久久精品理论片| 欧美在线黄色| 欧美一级精品大片| 亚洲韩国精品一区| 久久久久九九九九| 午夜天堂精品久久久久| 在线一区二区三区四区| 国产精品久久久久久久久久久久久久| 欧美精品v国产精品v日韩精品| 亚洲欧美日韩国产另类专区| 亚洲少妇最新在线视频| 在线视频免费在线观看一区二区| 99re66热这里只有精品3直播| 国产一区二区视频在线观看| 在线不卡a资源高清| 激情成人av|