大语言模型

424 个产品

Aymo AI 是面向团队的一体化 AI 平台，在单一协作工作区内整合多模型，支持模型切换、对比、文件分析、网页搜索和团队共享工作流。

Argmin AI 帮助团队将规则、文档和示例转化为可在发布前运行的 AI 评估，适合需要质量检查而无需自建评估代码或组建 ML 团队的产品与工程团队。

BaseRT 是专为 Apple Silicon Mac 打造的 LLM 运行时，可在本地设备上运行模型，支持端侧推理与本地编码代理工作流，强调速度与隐私。

Kimi K3 是 Moonshot AI 面向编程、知识工作与推理的前沿模型，支持 Kimi.com、Kimi Work、Kimi Code 和 Kimi API，具备 100 万 token 上下文与原生视觉能力。

Zro 是面向编码代理的私有推理端点，运行于欧盟基础设施，支持 OpenAI 兼容与 Anthropic 兼容访问，适合需要零请求保留的开源模型推理的开发者和团队。

derouter.ai 是面向 Claude 和 GPT 模型的 web API，尽量镜像 Anthropic 与 OpenAI 官方接口，提供固定且更低的 token 定价，并支持 Claude Code、Codex CLI 与 GPT Image 2 图像生成。

SuperCompress 是面向 LLM 应用的查询感知上下文压缩器，可在推理前减少输入 token，同时保留回答所需证据。开源、可在 CPU 上运行，并提供托管 API 和 Python 包。

Muse Spark 1.1 是 Meta Superintelligence Labs 推出的多模态推理模型，适用于智能体任务、编码、电脑操作与多模态理解。可通过 Meta Model API 公测版、Meta AI 应用和 meta.ai 的 Thinking 模式使用。

Auriko 是一款 LLM 推理路由 API，支持开发者通过一次集成接入多个模型提供商，专注于缓存感知的成本优化、路由控制与 AI 应用可靠性。

Opper AI 是一款欧盟托管的 AI 网关，可通过兼容 OpenAI SDK 的 API 访问 300+ 模型，并提供路由、可观测性、护栏与合规等可选控制平面，适合按量付费的生产级 AI 应用和代理。

Constellation Gate AI 是面向 AI agent 的网关，可筛查请求、脱敏敏感数据、记录不可篡改审计轨迹，并帮助降低 token 用量。支持桌面工具、CLI 路由和基于 SDK 的无代码接入。

LongCat-2.0 是 LongCat AI 发布的 1.6 万亿参数模型，强调完全基于国产芯片训练，并提供独立定价页面。

TuneLLM 是一款企业级平台，可将 Claude 或 GPT 风格的重复工作流蒸馏为部署在企业自有基础设施中的更小微调模型，适用于追求低推理成本与基准化质量的团队。

Alvoff Inference 是面向开发者的 OpenAI 兼容 API，支持语音转文字、文字转语音、embeddings 和聊天/代码生成；只需更换基础 URL，即可沿用熟悉的 SDK，按请求计费。

RunInfra 通过基准测试 GPU、调优受支持的运行时路径，并可部署托管 API 或导出自托管堆栈，帮助团队将开源模型转化为生产推理栈。

ClinePass 是 Cline 的付费订阅，提供精选开源权重模型访问，并带有 Product Hunt 首月促销。适合想简化 IDE 和 CLI 编码工作流的开发者。

discode.ai 是一款基于浏览器的 AI 聊天产品，可在多模型间路由提示，并提供环保影响、本地隐私和多模型验证控制，帮助你在成本、保密性与答案可信度之间做出平衡。

Heron 是一款面向 AI agents 和 LLM API 的被动可观测性工具，可从网络流量重建 agent 回合、工具调用和 LLM 交互，无需更改 SDK 或在路径代理。

Oxlo.ai 是一款具备 OpenAI 兼容接入、按请求月度计费的 AI inference API，适合开发者与 AI 团队构建助手、文档工作流及生产级推理任务，成本更可预测。

Crewdle Chat 将 GPT、Claude、Gemini 和 Grok 集成到同一企业聊天工作区，支持网页搜索、上传文档与按 token 计费，无需按席位付费。

...