UStackUStack
Browser Arena icon

Browser Arena

Browser Arena 开源、可复现实验基准,比较云端浏览器基础设施提供商在速度、可靠性与成本方面,面向AI浏览器代理与自动化。

Browser Arena

Browser Arena 是什么?

Browser Arena 是一个开源、可复现的基准测试网站,用于比较云端浏览器基础设施提供商在速度、可靠性和成本方面的表现。它以一致的表格形式呈现评估结果,便于您比较适用于 Web 自动化和 AI 浏览器代理工作流的提供商。

该项目由 Notte 构建,并作为开源基准托管,可复现(包括通过 Railway),支持添加提供商和基准测试。

主要特性

  • 开源基准数据和评估框架:网站明确标明为开源,支持透明查看比较结果的生成方式。
  • 可复现结果:基准测试可在 Railway 上复现,帮助团队重新运行或验证评估。
  • 三大维度标准化评分:结果组织成价值分数,均衡强调可靠性、延迟(速度)和成本。
  • 提供商比较表格,包含区域、运行次数和指标:每个提供商条目包括区域、运行次数、可靠性百分比、毫秒级延迟以及每小时成本。
  • 用户操作扩展基准集:UI 包含“Add a Provider”和“Add a Bench”提示,表示可扩展的基准目录。

如何使用 Browser Arena

  • 浏览现有提供商评估:从查看比较表格开始,了解列出提供商的可靠性、延迟和成本数据。
  • 使用价值分数快速筛选:通过显示的价值分数比较提供商,该分数反映可靠性、延迟和成本。
  • 如果您维护基准测试,请复现它们:使用项目的“reproduce”工作流(标明可在 Railway 上复现)运行或验证评估。
  • 扩展基准列表:如果需要更多覆盖,使用“Add a Provider”或“Add a Bench”贡献新比较。

使用场景

  • 为自动化选择云端浏览器提供商:使用表格比较提供商,以决定哪种基础设施最匹配您的可靠性和延迟需求。
  • 平衡速度与支出:将延迟(毫秒)与每小时成本并列比较,选择既符合性能又适合预算的提供商。
  • 验证代理工作流的可靠性:查看可靠性百分比,识别适用于长时间或重复 Web 自动化任务的低故障提供商。
  • 为内部决策运行可复现评估:对于需要可重复结果的团队,使用可复现设置重新运行基准,确认提供商性能稳定。
  • 贡献新基准或提供商:如果您构建自己的评估标准,添加提供商或基准,让他人使用相同框架比较结果。

常见问题

  • Browser Arena 是开源的吗? 是的。页面声明它是开源的。

  • 基准测试可复现吗? 网站表示基准测试可在 Railway 上复现。

  • Browser Arena 比较哪些指标? 表格比较可靠性、延迟(毫秒)和成本(每小时成本),并显示价值分数。

  • “价值分数”结果如何确定? 页面指出价值分数均衡覆盖可靠性、速度(延迟)和预算/成本,各占 33%。

  • 我可以添加自己的提供商或基准测试吗? UI 包含添加提供商和添加基准的选项,页面鼓励贡献。

替代方案

  • 托管浏览器自动化平台(通用型):这些通常直接用于运行浏览器自动化,而不是发布标准化的比较基准表格。
  • 您自己的内部基准框架:团队可不依赖公共比较网站,为特定工作负载定义测试,并在自家环境中测量可靠性/延迟/成本。
  • 其他开源基础设施基准仓库:相关项目可能聚焦不同系统(如计算、网络或通用浏览器测试),但可能不提供相同的提供商导向速度/可靠性/成本比较布局。
  • 云性能测试框架:此类工具可测量响应性和故障率,但可能需要更多设置来将结果转化为浏览器自动化的提供商比较。
Browser Arena | UStack