Caiとは?
CaiはmacOS向けの無料・オープンソース「AIアクションレイヤー」で、任意のアプリで選択した内容に直接アクションを実行します。アプリ切り替えを避けるのが核心で、テキストや画像を選択し、単一のショートカットで押して、プロンプト、スクリプト、OCR、issue作成などのインラインアクションを選択します。
ビルトインのローカルAI(MLX経由のMinistral 3Bを含む)を搭載し、デフォルトでローカル処理を維持する設計です。選択するモデルに応じて、ローカルモデルサーバーやオプションのクラウドプロバイダーにも接続可能です。
主な機能
- 選択ベースのアクション(クリップボード限定ではない): 強調したテキストや選択した画像に直接作用し、クリップボード履歴の保存や検索に留まりません。
- インラインショートカットワークフロー: ⌥Cを押してアクションリストを開き、実行するアクションを選択—作業中のコンテキストで結果を保持することを意図しています。
- テキストと画像向けスマートアクション: AIプロンプト、端末スクリプト、要約、翻訳、文法修正、**OCR(画像をテキストに)**などに対応。
- 開発者向け機能内蔵: 選択内容からGitHub issueやLinearチケットを作成;端末スタイルのスクリプティングもアクションとしてサポート。
- ローカル優先モデル対応: ビルトインローカルモデルを同梱し、オンデバイスでオフライン実行可能;クラウドはオプション。
- カスタムアクションライブラリ: カスタムプロンプト、シェルスクリプト、URLベースアクションで独自アクションを作成し、1キーストロークアクションとして保存。
Caiの使い方
- Homebrew経由でCaiをインストール(サイトにtap + caskインストールコマンドを提供)。
- 任意のアプリでテキストを選択(またはテキストを含む画像/スクリーンショットを選択)。
- ⌥Cを押してCaiのアクションリストを開く。
- アクションを選択(例: 要約、翻訳、OCR-to-textフロー実行、GitHub/Linearアイテム作成)。カスタムアクションを作成済みならビルトインと並んで表示。
ユースケース
- 同じアプリ内でエラーやメッセージを要約: 端末エラーメッセージやチャットテキストを選択し、⌥Cを押して要約や修正提案を生成するアクションを実行。
- スクリーンショットのOCRを実行し抽出テキストで次のアクション: テキストを含むスクリーンショットを選択し、**Image to Text (OCR)**を実行後、結果を別のアクション(例: 翻訳、要約、issue作成)にルーティング。
- 選択詳細をエンジニアリングチケットに変換: ドキュメントやメールドラフトの要件、ログ、コンテキストを選択し、Linearチケット(またはGitHub issue)を直接作成。
- 選択したコードや識別子から端末コマンド実行: Caiのシェルアクションでコマンドをパラメータ化(選択テキストを使用した例: PR検索やgitコマンド作成)。
- 再利用可能な1キーストロークプロンプトを作成: カスタムプロンプトテンプレートやURL検索アクションを保存し、将来の選択で単一ショートカットで繰り返し実行。
FAQ
-
Caiは本当に無料ですか?
はい。Caiは無料・オープンソースと記述されており、アプリ自体にサブスクリプションやアカウントは不要です。 -
APIキーやアカウントは必要ですか?
デフォルトのローカルセットアップでは不要。クラウドモデルプロバイダーを選択した場合、そのプロバイダーのAPIキーは必要とサイトに記載。 -
Caiはオフラインで使えますか?
サイトによると、ビルトインモデルとローカルLLMプロバイダーはオンデバイスで動作し、インターネット不要;クラウドプロバイダーはインターネット必須。 -
Caiはクリップボードマネージャーとどう違うのですか?
Caiは選択ベース:強調した内容にアクションを実行し、クリップボード履歴の保存・取得に焦点を当てていません。 -
アプリ切り替えが必要なチャットアプリとどう違うのですか?
Caiは選択テキスト上でインライン実行する設計で、同じショートカットワークフローを使い、別AIチャットアプリへの切り替えを避けます。
代替品
- クリップボードマネージャー(テキスト履歴ツール): クリップボード内容の検索・再利用を助けますが、現在の選択に直接AIやスクリプトを実行しません。
- コピー/ペーストワークフローのAIチャットアプリ: 要約、翻訳、応答を生成しますが、通常アプリ切り替えと手動テキスト移動が必要です。
- キーボード優先生産性ツール(ランチャー/自動化ユーティリティ): ホットキーからスクリプトやコマンドを実行するツールは類似ワークフローをサポートしますが、選択ベースAIアクション、ビルトインOCR、インラインレーティングに特化していません。
- ローカルLLM UI(オンデバイスのモデル実行): オフラインAIを提供しますが、テキスト貼り付けと手動プロンプト管理が必要で、選択駆動アクションやissue/チケット作成統合はありません。
代替品
Biji
Bijiは、革新的なツールと機能を通じて生産性を向上させるために設計された多目的プラットフォームです。
Tavus
TavusはAIがリアルタイムの対面コミュニケーションで見て・聞いて・応答。動画エージェントやデジタルツイン、AIコンパニオンをAPIで提供。
HiringPartner.ai
HiringPartner.ai は、自律型の AI エージェントが 24 時間 365 日稼働し、候補者のサーチ、スクリーニング、電話連絡、面接までを自動化する採用プラットフォームです。従来は数週間かかっていた採用リードタイムを、最短 48 時間まで短縮します。
Decision Jar
Decision Jarは仮想ジャーに選択肢を入れてスマホを振るだけで即決。AI提案と決定ログで判断の疲れを軽減します。
Planndu: Daily Task Planner
Plannduは、AI生成や内蔵のポモドーロタイマーなどのツールを活用して、ユーザーがタスクを整理し、プロジェクトを管理し、ルーチンを構築し、集中力を高めるのに役立つように設計された直感的な生産性アプリケーションです。
AgentMail
AgentMailはAIエージェント向けメール受信API。RESTで作成・送受信・検索し、双方向の会話を実現します。