Claude Mythos 5는 사이버보안 및 생물학 연구용 Anthropic 모델로, 엄선된 파트너 대상의 제한적 신뢰 액세스와 사이버보안·생물학·의료 분야 벤치마크 강점을 제공합니다.
NVIDIA Nemotron 3 Ultra는 긴 워크플로우의 추론, 컨텍스트 유지, 멀티턴 도구 사용에 최적화된 오픈 550B 파라미터 Mixture-of-Experts 모델입니다. 오픈 가중치와 파인튜닝 지원 제공.
Gemma 4 12B는 Google DeepMind의 멀티모달 AI 모델로, 노트북 로컬 추론에 적합하며 비전, 오디오, 텍스트를 하나의 아키텍처에서 지원합니다.
EchoFlow는 OpenRouter용 Android 채팅 앱으로, 자체 API 키를 사용하고 모델을 전환하며 대화 기록을 기기에 로컬 저장해 오프라인에서도 확인할 수 있습니다.
Tokenwise는 LLM 관측성과 비용 최적화 플랫폼으로, 각 API 호출을 모니터링하고 낭비를 찾아 모델 교체, 캐싱, 프롬프트 축소를 제안해 LLM 비용을 줄입니다.
MiniCPM5-1B은 로컬 어시스턴트, 코딩 에이전트, 도구 사용, 추론을 위한 10억 파라미터 오픈소스 언어 모델입니다. 긴 문맥과 빠른 채팅·사고 모드를 지원합니다.
Command A+는 복잡한 추론, 멀티모달·다국어 에이전트 워크플로우, 도구 사용을 위한 Cohere의 오픈소스 엔터프라이즈 언어 모델입니다. 비공개 배포에 적합하며 지원되는 오픈 추론 프레임워크 또는 Cohere의 관리형 Model Vault로 실행할 수 있습니다.
MashuPack은 로컬 코드 저장소의 필요한 부분을 선택해 ChatGPT, Claude 같은 AI 채팅에 맞는 깔끔한 텍스트 파일로 내보내는 브라우저 기반 도구입니다. 백엔드 업로드나 계정 없이 소프트웨어 기획, 디버깅, 코드베이스 검토에 적합합니다.
Krater는 ChatGPT, Claude, Gemini와 350개 이상의 AI 모델을 하나의 구독으로 제공하는 AI 워크스페이스입니다. API 키 없이 텍스트, 이미지, 영상, 오디오, 음악, 코드를 생성할 수 있습니다.
Harbor는 로컬 LLM 스택을 간편하게 실행하는 CLI 및 동반 앱입니다. 모델 백엔드, 채팅 프런트엔드, 웹 검색, 음성, 이미지 생성, 코딩 도구를 한 번에 구성하세요.
Perceptron Mk1은 비디오 이해, 이미지 추론, 구현형 추론을 위한 폐쇄형 멀티모달 모델입니다. 로보틱스와 물리 세계 워크플로우에 적합하며, 시각 데이터에서 구조화된 출력을 제공합니다.
MiniMax M3는 코딩과 에이전트 워크플로용 오픈웨이트 AI 모델로, 네이티브 멀티모달 이해와 100만 토큰 컨텍스트 윈도우를 제공합니다.
Edgee Fallback Models는 Anthropic 장애나 사용 한도 도달 시 다른 모델로 자동 전환해 Claude Code 세션을 유지하는 라우팅 레이어입니다. 코드 변경 없이 연속 작업을 돕습니다.
SemanticGuard는 OpenAI, Anthropic, Google의 LLM API를 위한 AI 게이트웨이로, 자체 검증 캐시로 비용 절감과 의미상 유사한 응답 캐싱, 캐시 장애 시에도 요청 유지를 지원합니다.
Gello는 Android에서 Hugging Face 언어 모델을 로컬로 실행해 Discord 봇으로 연결하는 앱입니다. 항상 켜진 온디바이스 AI 참여자를 Discord 채널에 둘 수 있습니다.
TrackNotch는 Claude, OpenAI, Cursor, Codex 등의 LLM 사용량을 노치나 메뉴 막대에 실시간 표시하는 macOS 네이티브 앱입니다. 데이터는 로컬에 저장되며 Keychain을 사용합니다.
Token Monitor — AI Context Tracker로 Claude.ai 대화의 실시간 컨텍스트 진행과 토큰 비용, 할당량 리셋, 잘림 위험 경고를 확인하세요.
PromptQuorum은 한 번에 25+ AI 모델에 프롬프트를 보내고, 합의 점수와 환각 위험 신호로 더 일관된 답을 비교·선택하도록 돕습니다.
Franz는 간결한 문법의 프로토타입 지향 함수형 언어로, LLVM IR 기반 네이티브 컴파일과 효과 제어·예측 가능한 클로저를 지원합니다.
Gemini 3.1 Flash-Lite는 초저지연과 고볼륨 작업에 최적화된 Gemini 3 시리즈 AI 모델로, Google Gemini Enterprise Agent Platform에서 효율적인 프로덕션 배포를 지원합니다.