Claude Mythos 5 是 Anthropic 面向网络安全与生物学研究的模型,采用严格受信访问,仅向经过审核的合作伙伴开放,并满足安全与数据保留要求。
NVIDIA Nemotron 3 Ultra 是一款开源 550B 参数 MoE 模型,专为长流程智能体工作流打造,支持推理、上下文保留与高效工具调用,并提供开源权重、配方和微调支持。
Gemma 4 12B 是来自 Google DeepMind 的多模态 AI 模型,支持笔记本本地推理,融合视觉、音频和文本,适合打造需要强推理能力且更省内存的 agentic 应用。
EchoFlow 是一款面向 OpenRouter 的 Android 聊天应用,支持使用自己的 API key、切换模型,并将对话本地存储在手机上,适合需要私密移动聊天界面和离线查看历史记录的用户。
Tokenwise 是一款 LLM 可观测性与成本优化平台,可监控每次 API 调用,识别浪费,并给出模型切换、缓存和提示词精简等优化建议,帮助团队降低 LLM 支出,同时持续审查生产质量。
MiniCPM5-1B 是一款开源 10 亿参数语言模型,适用于本地助手、编程代理、工具调用和推理任务,支持长上下文提示及快速聊天、思考模式,多种发布格式可匹配不同运行环境。
Command A+ 是 Cohere 的开源企业大语言模型,支持复杂推理、多模态和多语言代理工作流及工具调用,适合私有部署,可通过受支持的开源推理框架或 Cohere 托管的 Model Vault 运行。
MashuPack 是一款基于浏览器的代码上下文打包工具,可从本地代码仓库中选择部分内容,导出为一个干净的文本文件,适用于 ChatGPT、Claude 等 AI 聊天界面。适合软件规划、调试和代码库审查,无需后端上传或账号。
Krater 是一体化 AI 工作区,单一订阅即可使用 ChatGPT、Claude、Gemini 和 350+ AI 模型,无需管理 API 密钥,轻松生成文本、图片、视频、音频、音乐和代码。
Harbor 是一款 CLI 和配套应用,可快速搭建预配置的本地 LLM 技术栈,集成模型后端、聊天前端和相关服务,帮助你无需手动配置即可运行本地 AI 工作流、网页搜索、语音、图像生成和编码工具。
Perceptron Mk1 是一款闭源多模态模型,支持视频理解、图像推理和具身推理,面向机器人与物理世界工作流的结构化视觉输出需求。
MiniMax M3 是一款用于编程和 agent 工作流的开源权重 AI 模型,支持原生多模态理解与 1M token 超长上下文,适合长上下文推理、工具调用及复杂软件或研究任务。
Edgee Fallback Models 是面向 Claude Code 会话的路由层,当 Anthropic 中断或达到用量限制时,可自动切换到其他模型,持续运行开发流程,无需改代码或重启工作流。
SemanticGuard 是一款面向 OpenAI、Anthropic 和 Google LLM API 的 AI 网关,内置自验证缓存,可衡量节省、缓存语义相似响应,并在缓存不可用时保持请求继续。
Gello 是一款 Android 应用,可在本地运行 Hugging Face 语言模型,并将其作为 Discord 机器人使用。适合把闲置手机变成常久在线、端侧 AI 群聊成员。
TrackNotch 是一款原生 macOS 应用,可在 Mac 刘海或菜单栏实时显示 Claude、OpenAI、Cursor、Codex 等 LLM 使用情况。数据本地保存,密钥存储于钥匙串,并支持 Claude Code 上下文、限流与预算跟踪。
Token Monitor — AI Context Tracker 是一款 Chrome 扩展,为 Claude.ai 实时提供上下文进度与配额监控:截断风险提醒、每轮 token 成本徽标。
PromptQuorum 一次发送同一提示到 25+ AI 模型,基于一致性评分与幻觉风险信号对比输出,帮助你选更稳定答案。
Franz 是一种面向原型的函数式编程语言,语法精简、词法作用域;支持通过 LLVM IR 进行本地编译,并提供丰富标准库。
Gemini 3.1 Flash-Lite 是Gemini 3 系列AI模型,优化超低延迟与高并发任务,适用于 Gemini Enterprise Agent Platform 上的高性价比生产部署。