Puppeteer + pptxgenjs 实现生产环境高频批量导出方案

Created on 2025年9月6日

在企业级应用中,批量生成报表、数据可视化图表或演示文稿是常见需求。当这类需求从低频、小批量演变为高频、大批量时,技术方案的稳定性和性能就成为核心挑战。本文记录了我们团队使用 Puppeteer + pptxgenjs 实现批量导出功能的完整历程,从最初的简单实现,到遭遇生产环境稳定性问题,最终迁移到 Puppeteer Cluster 的优化方案。

我们的业务场景是:需要每天处理数百份数据分析报告的自动化导出,每份报告包含多个图表页面,最终生成 PPT 格式供业务人员使用。初期使用基础 Puppeteer 方案时,在高并发场景下频繁出现内存溢出、任务超时、浏览器崩溃等问题,成功率仅有 90% 左右,严重影响业务流程。

经过深入分析和重构,我们引入了 Puppeteer Cluster,配合完善的资源管理、错误处理机制,最终将任务处理速度提升了 3 倍,失败率降至 1% 以下,内存占用减少 60%。这篇文章将详细分享这个过程中的技术细节与踩坑经验。

初版实现:基于 Puppeteer 的方案

技术选型

在项目初期,我们选择了以下技术栈:

Puppeteer: Google 官方维护的无头浏览器工具,可以控制 Chrome/Chromium 进行页面渲染、截图、生成 PDF 等操作
pptxgenjs: 强大的 JavaScript PPT 生成库,支持丰富的样式和布局控制
集成方案: 使用 Puppeteer 将数据可视化页面渲染为图片,再用 pptxgenjs 将多张图片组装成 PPT

这个方案的优势在于:

可以复用 Web 端的图表组件(ECharts、AntV 等)
所见即所得,生成的图片与前端展示完全一致
技术栈统一,前后端都是 JavaScript/TypeScript

基础实现代码

最初的实现非常直接,核心逻辑如下:

import puppeteer from "puppeteer";
import PptxGenJS from "pptxgenjs";

// ❌ 问题代码:缺乏资源管理和错误处理
async function generateReport(reportData: ReportData) {
  // 启动浏览器
  const browser = await puppeteer.launch({
    headless: true,
  });

  const page = await browser.newPage();
  const pptx = new PptxGenJS();

  try {
    // 遍历每个图表页面
    for (const chartConfig of reportData.charts) {
      // 访问图表页面
      await page.goto(`http://localhost:3000/chart/${chartConfig.id}`);
      await page.waitForSelector(".chart-container");

      // 截图
      const screenshot = await page.screenshot({
        type: "png",
        encoding: "base64",
      });

      // 添加到 PPT
      const slide = pptx.addSlide();
      slide.addImage({
        data: `data:image/png;base64,${screenshot}`,
        x: 0.5,
        y: 0.5,
        w: 9,
        h: 5,
      });
    }

    // 生成 PPT 文件
    const fileName = `report-${reportData.id}.pptx`;
    await pptx.writeFile({ fileName });

    await browser.close();
    return { success: true, fileName };
  } catch (error) {
    await browser.close();
    throw error;
  }
}

// 批量处理多个报告
async function batchGenerate(reports: ReportData[]) {
  const results = [];
  for (const report of reports) {
    const result = await generateReport(report);
    results.push(result);
  }
  return results;
}

遇到的问题

这个实现在小规模测试时运行良好,但在生产环境面对高并发和大批量任务时,暴露出严重的稳定性问题:

❌ 内存泄漏

每个报告都会启动一个新的浏览器实例,如果异常退出时 browser.close() 未执行,浏览器进程会一直占用内存。在处理 100+ 个任务时,内存占用可达 3-4GB,甚至导致服务器 OOM。

❌ 并发限制

上述代码是串行处理,100 个任务需要 10-15 分钟。尝试手动实现并发时:

// ❌ 简单并发导致资源竞争
async function batchGenerateConcurrent(reports: ReportData[]) {
  const promises = reports.map((report) => generateReport(report));
  return await Promise.all(promises);
}

这会同时启动大量浏览器实例,CPU 和内存瞬间飙升至 100%,导致:

系统响应极慢
部分任务超时失败
浏览器崩溃

❌ 错误处理不足

单个任务失败会中断整个批次:

某个图表页面加载超时 → 整批任务失败
网络波动导致截图失败 → 没有重试机制
浏览器偶发崩溃 → 影响其他正常任务

❌ 资源竞争

多个 Puppeteer 实例同时访问本地开发服务器,导致:

端口占用冲突
渲染服务器负载过高
数据库连接池耗尽

问题诊断:生产环境的挑战

性能瓶颈分析

通过监控数据分析,我们发现以下问题:

资源消耗情况:

并发数	内存占用	CPU 使用率	平均响应时间	失败率
1 (串行)	~400MB	20-30%	6s/任务	1-2%
5	~1.2GB	60-80%	8s/任务	3-5%
10	~2.5GB	90-100%	15s/任务	8-12%
20+	OOM 崩溃	100%	N/A	50%+

关键发现:

每个浏览器实例占用 ~200-300MB 内存
并发数超过 8 后,系统性能急剧下降
失败率与并发数成正相关

稳定性问题根源

深入分析后,我们识别出以下根本原因:

1. Puppeteer 单实例模式的局限性

手动管理每个浏览器实例很容易出错:

没有统一的生命周期管理
异常退出时资源泄漏
难以追踪每个实例的状态

2. 缺乏任务队列管理

Promise.all() 简单粗暴:

无法控制并发上限
无法动态调整负载
任务间缺乏隔离

3. 没有重试机制

网络抖动、页面加载超时等暂时性问题没有重试:

一次失败直接标记为错误
没有指数退避策略
浪费了可恢复的任务

4. 缺少资源池管理

每个任务创建新浏览器:

启动开销大(每次 2-3 秒)
无法复用已有实例
资源利用率低

解决方案:引入 Puppeteer Cluster

为什么选择 Puppeteer Cluster

Puppeteer Cluster 是一个在 Puppeteer 之上构建的集群管理库,专门解决批量任务场景的痛点:

核心优势:

✅ 内置任务队列管理: 自动调度任务,控制并发数 ✅ 自动重试机制: 失败任务自动重试,支持自定义策略 ✅ 并发控制(Worker Pool): 复用浏览器实例,提升资源利用率 ✅ 更好的错误隔离: 单个任务失败不影响其他任务 ✅ 监控与统计支持: 内置事件系统,方便监控和日志

架构对比

特性	Puppeteer	Puppeteer Cluster
并发控制	手动管理 `Promise.all()`	自动 Worker Pool
任务队列	需自行实现	内置优先级队列
错误处理	手动 try-catch	自动重试 + 隔离
资源管理	容易泄漏	自动创建和回收
重试机制	无	可配置重试次数
监控	需自行实现	内置事件监听
性能	每次启动浏览器	复用实例

迁移实现代码

基于 Puppeteer Cluster 的完整重构:

import { Cluster } from "puppeteer-cluster";
import PptxGenJS from "pptxgenjs";

interface TaskData {
  reportId: string;
  charts: ChartConfig[];
}

interface TaskResult {
  reportId: string;
  screenshots: string[];
  success: boolean;
  error?: string;
}

// ✅ 使用 Puppeteer Cluster 管理资源
async function createExportCluster() {
  const cluster = await Cluster.launch({
    // 并发模式: CONTEXT 模式在页面间复用浏览器,性能最优
    concurrency: Cluster.CONCURRENCY_CONTEXT,

    // 最大并发数: 根据服务器配置调整 (CPU核心数 * 2 为经验值)
    maxConcurrency: 8,

    // 任务超时: 30秒
    timeout: 30000,

    // 重试配置
    retryLimit: 3,
    retryDelay: 2000,

    // 监控开关
    monitor: process.env.NODE_ENV === "production",

    // Puppeteer 启动参数优化
    puppeteerOptions: {
      headless: true,
      args: [
        "--no-sandbox",
        "--disable-setuid-sandbox",
        "--disable-dev-shm-usage", // 避免共享内存不足
        "--disable-gpu",
        "--disable-web-security",
        "--disable-features=IsolateOrigins,site-per-process",
        "--window-size=1920,1080",
      ],
    },
  });

  // 定义任务处理逻辑
  await cluster.task(async ({ page, data }: { page: any; data: TaskData }) => {
    const screenshots: string[] = [];

    try {
      // 遍历每个图表
      for (const chartConfig of data.charts) {
        // 访问图表页面
        await page.goto(`http://localhost:3000/chart/${chartConfig.id}`, {
          waitUntil: "networkidle2", // 等待网络空闲
          timeout: 15000,
        });

        // 等待图表渲染完成
        await page.waitForSelector(".chart-container", { timeout: 10000 });

        // 额外等待动画完成
        await page.waitForTimeout(500);

        // 设置视口大小
        await page.setViewport({
          width: 1920,
          height: 1080,
          deviceScaleFactor: 2, // 高清截图
        });

        // 截图
        const screenshot = await page.screenshot({
          type: "png",
          encoding: "base64",
          fullPage: false,
        });

        screenshots.push(screenshot as string);
      }

      return {
        reportId: data.reportId,
        screenshots,
        success: true,
      } as TaskResult;
    } catch (error) {
      return {
        reportId: data.reportId,
        screenshots: [],
        success: false,
        error: error instanceof Error ? error.message : "Unknown error",
      } as TaskResult;
    }
  });

  return cluster;
}

// 批量生成报告
async function batchGenerateReports(reports: ReportData[]) {
  const cluster = await createExportCluster();

  // 监控事件
  cluster.on("taskerror", (err, data) => {
    console.error(`任务失败 [${data.reportId}]:`, err.message);
  });

  cluster.on("queue", () => {
    const stats = cluster.getStats();
    console.log(
      `队列状态: ${stats.queued} 排队, ${stats.running} 运行中, ${stats.done} 已完成`,
    );
  });

  try {
    const results: TaskResult[] = [];

    // 入队所有任务
    for (const report of reports) {
      const taskData: TaskData = {
        reportId: report.id,
        charts: report.charts,
      };

      // execute 会返回任务处理结果
      const result = await cluster.execute(taskData);
      results.push(result);
    }

    // 等待所有任务完成
    await cluster.idle();

    // 生成 PPT 文件
    const pptResults = await generatePPTFiles(results);

    return {
      success: true,
      total: results.length,
      succeeded: results.filter((r) => r.success).length,
      failed: results.filter((r) => !r.success).length,
      files: pptResults,
    };
  } catch (error) {
    console.error("批量导出失败:", error);
    throw error;
  } finally {
    // 优雅关闭集群
    await cluster.close();
  }
}

// 根据截图生成 PPT
async function generatePPTFiles(results: TaskResult[]) {
  const files: string[] = [];

  for (const result of results) {
    if (!result.success) continue;

    const pptx = new PptxGenJS();
    pptx.layout = "LAYOUT_16x9";
    pptx.author = "Auto Export System";

    // 添加封面
    const coverSlide = pptx.addSlide();
    coverSlide.addText(`报告 ${result.reportId}`, {
      x: 1,
      y: 2.5,
      fontSize: 44,
      bold: true,
      color: "363636",
    });

    // 添加图表页面
    result.screenshots.forEach((screenshot, index) => {
      const slide = pptx.addSlide();
      slide.addImage({
        data: `data:image/png;base64,${screenshot}`,
        x: 0.5,
        y: 0.5,
        w: 9,
        h: 5.06,
        sizing: { type: "contain", w: 9, h: 5.06 },
      });

      // 添加页码
      slide.addText(`${index + 1} / ${result.screenshots.length}`, {
        x: 9,
        y: 5.8,
        fontSize: 12,
        color: "666666",
      });
    });

    const fileName = `./exports/report-${result.reportId}.pptx`;
    await pptx.writeFile({ fileName });
    files.push(fileName);
  }

  return files;
}

关键配置说明

并发模式选择

Puppeteer Cluster 提供三种并发模式:

模式	说明	资源占用	适用场景
`CONCURRENCY_BROWSER`	每个任务独立浏览器	高	任务间完全隔离
`CONCURRENCY_CONTEXT`	共享浏览器,独立上下文	中	推荐,性能与隔离的平衡
`CONCURRENCY_PAGE`	共享上下文,独立页面	低	轻量任务,Cookie 共享

我们选择 CONCURRENCY_CONTEXT 的原因:

复用浏览器进程,节省启动开销
不同任务的 Cookie、LocalStorage 隔离
内存占用适中

超时与重试配置

{
  timeout: 30000,        // 单个任务超时时间
  retryLimit: 3,         // 最大重试次数
  retryDelay: 2000,      // 重试延迟(毫秒)
}

重试策略说明:

首次失败后等待 2 秒重试
最多重试 3 次
适合处理网络抖动、页面加载慢等临时性问题

并发数设置

maxConcurrency: 8; // 根据服务器资源调整

经验值:

CPU 密集型: CPU核心数 × 1
I/O 密集型(如我们的场景): CPU核心数 × 2
监控内存占用,确保不超过可用内存的 70%

生产环境优化实践

资源优化

Puppeteer 启动参数优化

const optimizedArgs = [
  // 基础安全设置
  "--no-sandbox", // 禁用沙箱(Docker环境必需)
  "--disable-setuid-sandbox",

  // 内存优化
  "--disable-dev-shm-usage", // 使用 /tmp 而非 /dev/shm
  "--disable-gpu", // 禁用GPU加速
  "--disable-software-rasterizer",

  // 性能优化
  "--disable-extensions", // 禁用扩展
  "--disable-background-timer-throttling", // 禁用后台定时器节流
  "--disable-backgrounding-occluded-windows",
  "--disable-renderer-backgrounding",

  // 网络优化
  "--disable-web-security", // 禁用同源策略(内部使用)
  "--disable-features=IsolateOrigins,site-per-process",

  // 显示设置
  "--window-size=1920,1080",
  "--force-device-scale-factor=2", // 高清截图

  // 字体渲染(Linux需要)
  "--font-render-hinting=none",
];

内存监控与限制

// 监控内存使用情况
import os from "os";

function checkMemoryUsage() {
  const totalMem = os.totalmem();
  const freeMem = os.freemem();
  const usedMem = totalMem - freeMem;
  const usagePercent = (usedMem / totalMem) * 100;

  console.log(`内存使用率: ${usagePercent.toFixed(2)}%`);

  // 内存超过 80% 时告警
  if (usagePercent > 80) {
    console.warn("⚠️ 内存使用率过高,建议降低并发数");
  }

  return usagePercent;
}

// 动态调整并发数
async function createAdaptiveCluster() {
  const memUsage = checkMemoryUsage();
  let maxConcurrency = 8;

  if (memUsage > 70) {
    maxConcurrency = 4; // 内存紧张时降低并发
  } else if (memUsage < 40) {
    maxConcurrency = 12; // 资源充足时提高并发
  }

  return await Cluster.launch({
    concurrency: Cluster.CONCURRENCY_CONTEXT,
    maxConcurrency,
    // ... 其他配置
  });
}

并发控制策略

任务优先级队列

// 为紧急任务设置更高优先级
interface PriorityTask extends TaskData {
  priority: "high" | "normal" | "low";
}

async function executeWithPriority(cluster: Cluster, tasks: PriorityTask[]) {
  // 按优先级排序
  const sortedTasks = tasks.sort((a, b) => {
    const priorityMap = { high: 3, normal: 2, low: 1 };
    return priorityMap[b.priority] - priorityMap[a.priority];
  });

  // 分批处理
  const highPriorityTasks = sortedTasks.filter((t) => t.priority === "high");
  const normalTasks = sortedTasks.filter((t) => t.priority === "normal");
  const lowTasks = sortedTasks.filter((t) => t.priority === "low");

  // 先处理高优先级任务
  for (const task of highPriorityTasks) {
    await cluster.queue(task);
  }

  await cluster.idle();

  // 再处理普通和低优先级任务
  for (const task of [...normalTasks, ...lowTasks]) {
    await cluster.queue(task);
  }
}

限流策略

import rateLimit from "express-rate-limit";

// API 层面限流
const exportLimiter = rateLimit({
  windowMs: 15 * 60 * 1000, // 15分钟
  max: 50, // 最多50个请求
  message: "导出请求过于频繁,请稍后再试",
});

app.post("/api/export", exportLimiter, async (req, res) => {
  // 处理导出请求
});

错误处理与降级

重试机制增强

// 自定义重试逻辑
cluster.on("taskerror", async (err, data, willRetry) => {
  if (willRetry) {
    console.log(`任务 ${data.reportId} 失败,将进行第 ${data.tries} 次重试`);
  } else {
    console.error(`任务 ${data.reportId} 最终失败:`, err.message);

    // 降级方案: 使用默认模板
    await generateFallbackReport(data.reportId);
  }
});

// 降级方案: 生成简化版报告
async function generateFallbackReport(reportId: string) {
  const pptx = new PptxGenJS();
  const slide = pptx.addSlide();

  slide.addText("报告生成失败", {
    x: 1,
    y: 2,
    fontSize: 32,
    color: "FF0000",
  });

  slide.addText("请联系技术支持或稍后重试", {
    x: 1,
    y: 3,
    fontSize: 18,
  });

  await pptx.writeFile({ fileName: `./exports/fallback-${reportId}.pptx` });
}

错误日志收集

import winston from "winston";

const logger = winston.createLogger({
  level: "info",
  format: winston.format.json(),
  transports: [
    new winston.transports.File({ filename: "error.log", level: "error" }),
    new winston.transports.File({ filename: "combined.log" }),
  ],
});

// 记录详细错误信息
cluster.on("taskerror", (err, data) => {
  logger.error("Task failed", {
    reportId: data.reportId,
    error: err.message,
    stack: err.stack,
    timestamp: new Date().toISOString(),
    tries: data.tries,
  });
});

监控与日志

关键指标监控

class ExportMonitor {
  private stats = {
    totalTasks: 0,
    successTasks: 0,
    failedTasks: 0,
    totalTime: 0,
    startTime: Date.now(),
  };

  recordSuccess(duration: number) {
    this.stats.successTasks++;
    this.stats.totalTasks++;
    this.stats.totalTime += duration;
  }

  recordFailure() {
    this.stats.failedTasks++;
    this.stats.totalTasks++;
  }

  getReport() {
    const { totalTasks, successTasks, failedTasks, totalTime, startTime } =
      this.stats;
    const avgTime = totalTasks > 0 ? totalTime / totalTasks : 0;
    const successRate = totalTasks > 0 ? (successTasks / totalTasks) * 100 : 0;
    const elapsedMinutes = (Date.now() - startTime) / 60000;

    return {
      总任务数: totalTasks,
      成功数: successTasks,
      失败数: failedTasks,
      成功率: `${successRate.toFixed(2)}%`,
      平均耗时: `${avgTime.toFixed(2)}ms`,
      运行时长: `${elapsedMinutes.toFixed(2)}分钟`,
      吞吐量: `${(totalTasks / elapsedMinutes).toFixed(2)}任务/分钟`,
    };
  }
}

// 使用监控
const monitor = new ExportMonitor();

cluster.on("taskerror", () => monitor.recordFailure());

// 任务完成时记录
const startTime = Date.now();
const result = await cluster.execute(taskData);
const duration = Date.now() - startTime;

if (result.success) {
  monitor.recordSuccess(duration);
}

// 定期输出报告
setInterval(() => {
  console.table(monitor.getReport());
}, 60000); // 每分钟输出一次

pptxgenjs 集成要点

图片处理优化

图片尺寸计算与适配

interface ImageDimensions {
  width: number;
  height: number;
}

// 计算适配 PPT 的图片尺寸
function calculateImageSize(
  original: ImageDimensions,
  maxWidth: number = 9,
  maxHeight: number = 5.06,
): { w: number; h: number } {
  const aspectRatio = original.width / original.height;
  const maxAspectRatio = maxWidth / maxHeight;

  let width: number, height: number;

  if (aspectRatio > maxAspectRatio) {
    // 宽度优先
    width = maxWidth;
    height = maxWidth / aspectRatio;
  } else {
    // 高度优先
    height = maxHeight;
    width = maxHeight * aspectRatio;
  }

  return { w: width, h: height };
}

// 使用
const size = calculateImageSize({ width: 1920, height: 1080 });
slide.addImage({
  data: imageBase64,
  x: (10 - size.w) / 2, // 居中
  y: (5.625 - size.h) / 2,
  w: size.w,
  h: size.h,
});

图片压缩

import sharp from "sharp";

// 压缩 base64 图片
async function compressImage(base64: string): Promise<string> {
  // 解码 base64
  const buffer = Buffer.from(base64, "base64");

  // 使用 sharp 压缩
  const compressed = await sharp(buffer)
    .resize(1920, 1080, {
      fit: "inside",
      withoutEnlargement: true,
    })
    .png({ quality: 85, compressionLevel: 9 })
    .toBuffer();

  return compressed.toString("base64");
}

模板设计

动态内容与静态模板分离

// 定义 PPT 模板
class ReportTemplate {
  private pptx: PptxGenJS;

  constructor() {
    this.pptx = new PptxGenJS();
    this.setupDefaults();
  }

  private setupDefaults() {
    // 全局设置
    this.pptx.layout = "LAYOUT_16x9";
    this.pptx.author = "Auto Export System";

    // 主题颜色
    this.pptx.theme = {
      headFontFace: "Arial",
      bodyFontFace: "Calibri",
    };
  }

  // 添加封面
  addCoverSlide(title: string, subtitle: string) {
    const slide = this.pptx.addSlide();

    // 背景色
    slide.background = { color: "4472C4" };

    // 标题
    slide.addText(title, {
      x: 1,
      y: 2,
      fontSize: 44,
      bold: true,
      color: "FFFFFF",
    });

    // 副标题
    slide.addText(subtitle, {
      x: 1,
      y: 3.2,
      fontSize: 24,
      color: "E0E0E0",
    });

    // 日期
    slide.addText(new Date().toLocaleDateString("zh-CN"), {
      x: 1,
      y: 5,
      fontSize: 16,
      color: "FFFFFF",
    });

    return this;
  }

  // 添加图表页
  addChartSlide(title: string, imageBase64: string) {
    const slide = this.pptx.addSlide();

    // 标题栏
    slide.addText(title, {
      x: 0.5,
      y: 0.2,
      fontSize: 24,
      bold: true,
      color: "363636",
    });

    // 图表图片
    slide.addImage({
      data: `data:image/png;base64,${imageBase64}`,
      x: 0.5,
      y: 1,
      w: 9,
      h: 4.5,
    });

    return this;
  }

  // 生成文件
  async save(fileName: string) {
    await this.pptx.writeFile({ fileName });
  }
}

// 使用模板
const template = new ReportTemplate();
template
  .addCoverSlide("2024 年度数据分析报告", "自动生成")
  .addChartSlide("销售趋势", screenshot1)
  .addChartSlide("用户增长", screenshot2);

await template.save("report.pptx");

性能优化

流式生成大文件

// 分批处理大量图表
async function generateLargePPT(charts: ChartConfig[]) {
  const pptx = new PptxGenJS();
  const BATCH_SIZE = 10;

  for (let i = 0; i < charts.length; i += BATCH_SIZE) {
    const batch = charts.slice(i, i + BATCH_SIZE);

    // 并发截图
    const screenshots = await Promise.all(
      batch.map((chart) => captureChart(chart.id)),
    );

    // 添加到 PPT
    screenshots.forEach((screenshot, index) => {
      const slide = pptx.addSlide();
      slide.addImage({
        data: screenshot,
        x: 0.5,
        y: 0.5,
        w: 9,
        h: 5,
      });
    });

    console.log(`已处理 ${i + batch.length}/${charts.length} 张图表`);
  }

  await pptx.writeFile({ fileName: "large-report.pptx" });
}

实战对比:优化前后数据

基于我们的生产环境真实数据(100 个报告,每个报告 5 张图表):

指标	Puppeteer (串行)	Puppeteer (并发 10)	Puppeteer Cluster
总耗时	~10 分钟	~4 分钟	~3 分钟
内存峰值	500MB	2.5GB (OOM 风险)	~800MB
CPU 使用率	25%	95%+	50-60%
失败率	2%	10-15%	<1%
平均响应	6s/任务	15s/任务(竞争)	3.5s/任务
资源利用率	低	不稳定	高且稳定

关键改进:

✅ 性能提升 3.3 倍: 从 10 分钟降至 3 分钟 ✅ 内存优化 68%: 峰值从 2.5GB 降至 800MB ✅ 失败率降低 90%: 从 10% 降至 <1% ✅ 系统稳定性: CPU 使用平稳,无 OOM 风险

避坑指南

常见陷阱

❌ 忘记关闭浏览器/页面导致内存泄漏

// 错误示例
async function badExample() {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();

  // 异常时没有关闭
  await page.goto(url);

  // 如果这里抛出异常,browser 永不关闭
}

// ✅ 正确: 使用 Cluster 自动管理
// Cluster 会自动处理资源回收,无需手动关闭

❌ 并发数设置过高导致系统崩溃

// 错误示例
maxConcurrency: 50; // 太高!

// ✅ 正确: 根据实际资源调整
maxConcurrency: Math.max(os.cpus().length * 2, 4);

❌ 没有设置超时导致任务卡死

// 错误示例
await page.goto(url); // 可能永远等待

// ✅ 正确: 设置合理超时
await page.goto(url, {
  timeout: 15000,
  waitUntil: "networkidle2",
});

❌ 错误处理不完善导致雪崩

// 错误示例
Promise.all(tasks); // 一个失败全部终止

// ✅ 正确: 使用 Cluster 的错误隔离
// 单个任务失败不影响其他任务

最佳实践

✅ 使用 Cluster 的自动资源管理

让 Cluster 负责浏览器生命周期,避免手动管理的复杂性和风险。

✅ 根据服务器配置合理设置并发数

// 推荐公式
const maxConcurrency = Math.min(
  os.cpus().length * 2, // CPU 核心数的2倍
  Math.floor(os.freemem() / (300 * 1024 * 1024)), // 可用内存 / 300MB
);

✅ 完善的监控和告警机制

实时监控任务成功率
CPU/内存使用率告警
失败任务详细日志
定期生成统计报告

✅ 任务幂等性设计

确保任务可以安全重试:

使用唯一的报告 ID
生成文件前检查是否已存在
支持断点续传

✅ 优雅关闭和资源清理

// 监听进程退出信号
process.on("SIGINT", async () => {
  console.log("收到退出信号,正在清理资源...");

  await cluster.idle(); // 等待当前任务完成
  await cluster.close(); // 关闭集群

  process.exit(0);
});

总结

核心要点

Puppeteer Cluster 是生产环境批量任务的更好选择
- 内置任务队列、重试机制、资源管理
- 大幅降低开发复杂度和维护成本
并发控制和错误处理是关键
- 根据服务器资源动态调整并发数
- 完善的重试和降级策略
- 单个任务失败不应影响整体
监控和日志不可或缺
- 实时监控任务状态和系统资源
- 详细的错误日志便于问题排查
- 定期生成统计报告评估系统健康度
资源优化需要持续迭代
- Puppeteer 启动参数优化
- 图片压缩和尺寸适配
- 根据监控数据不断调优

技术选型建议

何时使用 Puppeteer:

小批量任务(< 10 个)
一次性的数据导出
开发测试阶段

何时使用 Puppeteer Cluster:

高频批量任务(每天 > 100 个)
生产环境稳定性要求高
需要并发控制和资源管理
推荐用于所有生产环境场景

极高并发场景(> 1000/小时):

考虑分布式部署
使用消息队列(RabbitMQ、Redis)解耦
微服务架构,独立的导出服务
Serverless 方案(AWS Lambda + 外部存储)

延伸思考

分布式部署方案
- 多台服务器组成集群
- 使用 Redis 作为任务队列
- 负载均衡和故障转移
Serverless 化可能性
- AWS Lambda + Chrome Layer
- 按需计算,成本优化
- 无需维护服务器
其他替代方案
- Playwright: 跨浏览器支持,API 更现代
- 无头 Chrome + CDP: 更底层的控制
- 纯后端渲染: 如 node-canvas,但功能有限

通过这次从 Puppeteer 到 Puppeteer Cluster 的迁移,我们不仅解决了生产环境的稳定性问题,还建立了一套完整的批量导出解决方案。希望这篇文章能帮助你在类似场景下少走弯路,快速构建高性能、高可靠的自动化导出系统。