UStackUStack
Cai icon

Cai

CaiはmacOS向けの無料・オープンソースAIアクションレイヤー。テキスト/画像を選び⌥CでプロンプトやOCR、端末スクリプトを実行。

Cai

Caiとは?

CaiはmacOS向けの無料・オープンソース「AIアクションレイヤー」で、任意のアプリで選択した内容に直接アクションを実行します。アプリ切り替えを避けるのが核心で、テキストや画像を選択し、単一のショートカットで押して、プロンプト、スクリプト、OCR、issue作成などのインラインアクションを選択します。

ビルトインのローカルAI(MLX経由のMinistral 3Bを含む)を搭載し、デフォルトでローカル処理を維持する設計です。選択するモデルに応じて、ローカルモデルサーバーやオプションのクラウドプロバイダーにも接続可能です。

主な機能

  • 選択ベースのアクション(クリップボード限定ではない): 強調したテキストや選択した画像に直接作用し、クリップボード履歴の保存や検索に留まりません。
  • インラインショートカットワークフロー: ⌥Cを押してアクションリストを開き、実行するアクションを選択—作業中のコンテキストで結果を保持することを意図しています。
  • テキストと画像向けスマートアクション: AIプロンプト端末スクリプト要約翻訳文法修正、**OCR(画像をテキストに)**などに対応。
  • 開発者向け機能内蔵: 選択内容からGitHub issueLinearチケットを作成;端末スタイルのスクリプティングもアクションとしてサポート。
  • ローカル優先モデル対応: ビルトインローカルモデルを同梱し、オンデバイスでオフライン実行可能;クラウドはオプション。
  • カスタムアクションライブラリ: カスタムプロンプト、シェルスクリプト、URLベースアクションで独自アクションを作成し、1キーストロークアクションとして保存。

Caiの使い方

  1. Homebrew経由でCaiをインストール(サイトにtap + caskインストールコマンドを提供)。
  2. 任意のアプリでテキストを選択(またはテキストを含む画像/スクリーンショットを選択)。
  3. ⌥Cを押してCaiのアクションリストを開く。
  4. アクションを選択(例: 要約、翻訳、OCR-to-textフロー実行、GitHub/Linearアイテム作成)。カスタムアクションを作成済みならビルトインと並んで表示。

ユースケース

  • 同じアプリ内でエラーやメッセージを要約: 端末エラーメッセージやチャットテキストを選択し、⌥Cを押して要約や修正提案を生成するアクションを実行。
  • スクリーンショットのOCRを実行し抽出テキストで次のアクション: テキストを含むスクリーンショットを選択し、**Image to Text (OCR)**を実行後、結果を別のアクション(例: 翻訳、要約、issue作成)にルーティング。
  • 選択詳細をエンジニアリングチケットに変換: ドキュメントやメールドラフトの要件、ログ、コンテキストを選択し、Linearチケット(またはGitHub issue)を直接作成。
  • 選択したコードや識別子から端末コマンド実行: Caiのシェルアクションでコマンドをパラメータ化(選択テキストを使用した例: PR検索やgitコマンド作成)。
  • 再利用可能な1キーストロークプロンプトを作成: カスタムプロンプトテンプレートやURL検索アクションを保存し、将来の選択で単一ショートカットで繰り返し実行。

FAQ

  • Caiは本当に無料ですか?
    はい。Caiは無料・オープンソースと記述されており、アプリ自体にサブスクリプションやアカウントは不要です。

  • APIキーやアカウントは必要ですか?
    デフォルトのローカルセットアップでは不要。クラウドモデルプロバイダーを選択した場合、そのプロバイダーのAPIキーは必要とサイトに記載。

  • Caiはオフラインで使えますか?
    サイトによると、ビルトインモデルとローカルLLMプロバイダーはオンデバイスで動作し、インターネット不要;クラウドプロバイダーはインターネット必須。

  • Caiはクリップボードマネージャーとどう違うのですか?
    Caiは選択ベース:強調した内容にアクションを実行し、クリップボード履歴の保存・取得に焦点を当てていません。

  • アプリ切り替えが必要なチャットアプリとどう違うのですか?
    Caiは選択テキスト上でインライン実行する設計で、同じショートカットワークフローを使い、別AIチャットアプリへの切り替えを避けます。

代替品

  • クリップボードマネージャー(テキスト履歴ツール): クリップボード内容の検索・再利用を助けますが、現在の選択に直接AIやスクリプトを実行しません。
  • コピー/ペーストワークフローのAIチャットアプリ: 要約、翻訳、応答を生成しますが、通常アプリ切り替えと手動テキスト移動が必要です。
  • キーボード優先生産性ツール(ランチャー/自動化ユーティリティ): ホットキーからスクリプトやコマンドを実行するツールは類似ワークフローをサポートしますが、選択ベースAIアクション、ビルトインOCR、インラインレーティングに特化していません。
  • ローカルLLM UI(オンデバイスのモデル実行): オフラインAIを提供しますが、テキスト貼り付けと手動プロンプト管理が必要で、選択駆動アクションやissue/チケット作成統合はありません。
Cai | UStack