Wallie

Wallie 是一款开源 AI 直播助手，能观看屏幕、聆听聊天并以可配置人设生成实时解说。支持本地运行、使用自有密钥，适合无真人出镜内容、自动化直播和实时互动。

AI语音助手

AI角色生成

AI头像生成器

开源 AI 直播助手

Wallie 是一个开源 AI 直播助手项目，能够观察并聆听屏幕上正在发生的内容、监听聊天，并以预设人设生成实时解说。其核心目的是让自动化或无真人出镜的直播，比短小的演示型 AI 机器人更连续、更具响应性。

该仓库描述了一种可在浏览器中配置的工作流：你可以选择人设、语音、语言模型、平台和头像。随后，Wallie 会通过语音合成和 OBS 或虚拟声卡等直播工具路由输出，同时让系统在用户自己的机器上使用用户自己的密钥运行。

核心能力

多模态直播反应循环

Wallie 将屏幕视觉、聊天/语音输入、语言生成和文本转语音结合起来，使其能够在直播过程中实时反应，而不是只生成孤立回复。

结构化人设设计

人设系统允许你定义身份、声音、幽默风格、口头禅、观点、禁忌话题和其他角色细节，而不是只依赖单一提示词。

长会话记忆管理

滚动摘要器、会话笔记和跨会话记忆有助于系统在更长的直播中保留上下文，并避免丢失早先的话题。

反应过滤与重复控制

注意力和去重系统可减少重复、限制提问循环，并判断屏幕变化是否值得回应或应被忽略。

可替换的提供商与输出

提供商支持涵盖多个 LLM、TTS、聊天和头像选项，示例包括 OpenAI、Anthropic、Google Gemini、Groq、Ollama、Fish Audio、ElevenLabs、Piper、Twitch、YouTube、Kick 和 VTube Studio。

本地化、浏览器管理式设置

该项目被描述为可在浏览器中配置，并旨在使用用户自己的密钥在用户的机器上运行。

实际用途

自动化直播
构建一个会评论游戏、浏览或桌面活动的直播 AI 主播，同时长期保持选定的人设。
无真人出镜内容制作
创建无真人出镜内容，由 AI 代替真人上镜提供声音和反应。
长时段解说
利用记忆和去重系统，让长直播避免重复发言或丢失前文脉络。
头像驱动的直播呈现
在直播设置中结合 OBS、虚拟声卡和 Live2D 头像，让 AI 输出同时驱动音频和视觉呈现。
提供商与工作流测试
在浏览器中尝试不同的 LLM、TTS 和平台组合，以匹配本地、高级或完全离线的工作流。

Pros and Cons

Pros

将屏幕视觉、聊天/语音、人设设计和语音输出整合到一个直播工作流中。
提供对人格、记忆、节奏和反应过滤的结构化控制，而不是只依赖单一提示词。
支持在 LLM、TTS、聊天和头像层使用多种提供商选项。
面向更长时间的会话设计，配有滚动摘要和会话笔记以保留上下文。
在用户自己的机器上使用他们自己的密钥本地运行，适合自托管工作流。

Cons

该项目以 GitHub 仓库形式呈现，因此价格和许可证需要在仓库中查看，而不是在产品结账页面上查看。
公开 README 中的一些集成细节比较宽泛，因此具体设置复杂度取决于你选择的模型、语音、聊天和头像提供商。

FAQ

Wallie 会在本地运行吗？

Wallie 设计为在你的机器上使用你自己的密钥本地运行。README 也展示了通过基于浏览器的仪表盘和配置文件系统进行设置与使用。

Wallie 用来做什么？

源描述将 Wallie 说明为一款 AI 直播助手，可对屏幕活动做出反应、聆听聊天、使用人设，并通过 OBS 或虚拟声卡输出语音。它适用于无真人出镜内容、自动化 AI 直播和实时解说。

Wallie 的可配置程度如何？

README 将 Wallie 描述为可在浏览器中配置，并可在 LLM、TTS、聊天和头像选项之间切换。具体设置步骤记录在指南和 README 中，而不是产品标题里。

Wallie 的价格是多少？

仓库页面本身没有列出商业产品价格。由于它是一个开源 GitHub 项目，产品页面未提供定价信息。

Quick Facts

类别: AI 直播 / 开发者工具
来源域名: github.com
产品类型: 开源仓库
主要用途: 无真人出镜内容、自动化 AI 直播、实时解说
运行方式: 在用户自己的机器上本地运行
仓库语言: 基于 Python 的项目结构

Wallie 替代品

Codex Plugins

Codex Plugins 将可复用技能、应用集成和 MCP 服务器打包为工作流，可在 Codex 应用中安装或通过 Codex CLI 使用，帮助扩展连接服务任务、复用指令和团队共享流程。

PXZ AI

一个集成图像、视频、语音、写作和聊天工具的全能AI平台，以增强创造力和协作。

Gemma AI

Gemma AI 是一款电话提醒应用，会按计划给你打电话提醒，而不是推送通知。支持 Google Calendar 同步与自然对话式通话交互，帮助你更直接地按时安排。

Claude Overlay

Claude Overlay 是适用于 Claude Code 的 Windows 桌面悬浮层，可读取屏幕内容，方便你在当前应用内提问、查看内容并请求编辑；通过现有 Claude 订阅和 Claude CLI 运行，无需单独 API key。

Spotit

Spotit 是 macOS 应用：卡在其他 App 时读取屏幕，用语音提问并在界面高亮准确点击位置，提供实时引导。

AakarDev AI

AakarDev AI 帮助团队在一个仪表板中管理 AI provider 访问、项目级设置、日志和分析，支持 BYOK 工作流，并涵盖 OpenAI、Google Gemini、Anthropic、Groq、Mistral AI 和 Perplexity AI。