Obsidian に、最高最新のLLMかましたいなーと思ってた
以下の手順で、ObsidianでGemini CLIが使えた
- Obsidian Terminal インストール
- .zshrc に node パス設定
- 再起動 → darwinintegratedDefault
パスを設定する
参考
その後、ObsidianにGemini CLIを導入して、数分で6335文字書いてくれた内容はこちら。雑な指示でこれなんで、しっかり指示すればもっとよい記事を生成してくれる。しかも無料。使わない手はない
↓
はじめに:なぜObsidianに「外部のAI」を接続するのか?
Obsidianは、私たちの思考を記録し、繋げ、育てるための強力な「第二の脳」です。その哲学の根幹には、ローカルファースト、マークダウンによる普遍性、そしてユーザーによる完全なコントロールがあります。
だからこそ、多くのパワーユーザーは、外部のクラウドサービスや「ブラックボックス」な機能に対して、健全な警戒心を持っていることでしょう。
では、なぜその神聖な領域に、あえて「AI」という外部の知性を招き入れるのでしょうか?
答えは 「知的生産のサイクルを、Obsidian内で完結させ、かつ加速させるため」 です。
これまで、リサーチ、要約、翻訳、ブレインストーミングといった作業は、ブラウザとObsidianの間を何度も往復する必要がありました。このコンテキストスイッチは、集中力を削ぎ、思考の流れを中断させます。
しかし、もしAIが、あなたの意のままに動く「思考の触媒」として、Obsidian内に存在したとしたら? テキストを選択し、キーボードショートカット一発で、要約、翻訳、リファクタリング、アイデアの提案が完了するとしたら?
本記事で紹介する「Gemini CLI」は、まさにその未来を実現するための、最もObsidianらしい、パワーユーザー向けのアプローチです。
GUIのプラグインが提供する手軽さとは一線を画す、「CUI(コマンドライン・ユーザーインターフェース)」による連携は、あなたに究極のコントロールと無限の拡張性をもたらします。
この記事を読み終える頃には、あなたはGemini CLIの魅力を深く理解し、自分のObsidian環境に導入するための具体的な手順をすべて手に入れているはずです。
Gemini CLIとは何か? なぜパワーユーザー向けなのか?
Gemini CLIは、Googleが提供する公式のコマンドラインツールです。これにより、ターミナル(コマンドプロンプトやPowerShellなど)から直接、Googleの高性能な生成AIモデル「Gemini」と対話できます。
多くのAI連携プラグインが、グラフィカルなインターフェース(GUI)を通じてAI機能を提供するのに対し、Gemini CLIはテキストベースのコマンドですべてを操作します。
GUIプラグインとの根本的な違い
項目 | GUIベースのAIプラグイン | Gemini CLI (CUIベース) |
---|---|---|
操作方法 | マウス操作、設定画面でのクリック | キーボード、コマンド入力 |
処理の透明性 | ブラックボックス化されがち | 入力と出力が明確。パイプ等で他ツールと連携可能 |
カスタマイズ性 | プラグイン開発者が提供する範囲内 | 無限。シェルスクリプトで自由に組み合わせ可能 |
速度・軽快さ | UIの描画やバックグラウンド処理で重くなることも | 非常に高速・軽量。テキストのやり取りに特化 |
学習コスト | 低い。直感的に使える | やや高い。コマンドの知識が必要 |
連携の思想 | 「機能を追加する」 | 「既存のワークフローにAIを組み込む」 |
GUIプラグインが「AIという新しい機能を追加する」アプローチだとすれば、Gemini CLIは 「テキスト処理というObsidianの核となる作業を、AIで強化する」 アプローチです。これは、Vimのキーバインドで操作効率を極めたり、自作のスクリプトで定型作業を自動化したりするObsidianパワーユーザーの思想と、極めて高い親和性を持ちます。
あなたが求めるのは、誰かが作った便利機能ではなく、 「自分の手で作り上げる、自分だけの知的生産環境」 のはず。Gemini CLIは、そのための最高の素材となるのです。
【本編】ハンズオン:ObsidianにGemini CLIを導入する全手順
ここからが本題です。あなたのObsidianに、Gemini CLIという強力なエンジンを搭載するための具体的な手順を、ステップバイステップで解説します。
ステップ0:前提条件の確認
以下の3つが揃っていることを確認してください。
- Googleアカウント : GeminiのAPIを利用するために必須です。
- Node.jsとnpm : Gemini CLIをインストールするために必要です。ターミナルで
node -v
とnpm -v
を実行し、バージョンが表示されればOKです。 - Obsidianと「Terminal」プラグイン : ObsidianとCLIツールを連携させるためのコミュニティプラグインです。まだインストールしていない場合は、Obsidianの「設定」→「コミュニティプラグイン」から「Terminal」をインストールして有効化してください。
ステップ1:Gemini CLIのインストール
まず、お使いのPCにGemini CLIをインストールします。ターミナルを開き、以下のコマンドを実行してください。
-g
はグローバルインストールを意味し、PCのどこからでも gemini
コマンドが使えるようになります。インストール後、以下のコマンドで正しくインストールされたか確認しましょう。
バージョン番号が表示されれば、第一段階は成功です。
ステップ2:Google AI APIキーの取得と設定
次に、Gemini CLIがGoogleのAIと通信するための「鍵」となるAPIキーを取得します。
- Google AI Studioにアクセス : にアクセスし、Googleアカウントでログインします。
- APIキーの作成 : 左側のメニューから「Get API key」を選択し、「Create API key in new project」をクリックします。
- キーのコピー : 生成されたAPIキー(長い英数字の羅列)をコピーします。 このキーは絶対に他人に公開しないでください。
取得したAPIキーを、Gemini CLIが読み込めるように環境変数として設定します。
macOS / Linux の場合:
お使いのシェル設定ファイル(.zshrc
, .bashrc
など)に、以下の1行を追記します。
Windows の場合:
PowerShellで以下のコマンドを実行します。
設定後、ターミナルを再起動してください。以下のコマンドを実行し、エラーが出なければAPIキーが正しく認識されています。
利用可能なモデルの一覧が表示されれば、認証は成功です。
ステップ3:Obsidian の Terminalプラグインの設定
いよいよObsidianとGemini CLIを接続します。
- Obsidianの「設定」を開き、左側の「コミュニティプラグイン」欄から「Terminal」を選択します。
- 「New command」ボタンをクリックして、新しいコマンド作成画面を開きます。
ステップ4:最初のコマンド「選択範囲の要約」を作成する
最も代表的なユースケースである「選択したテキストの要約」コマンドを作ってみましょう。
1. コマンド名を設定
- 分かりやすい名前を付けます。例:「Gemini: 選択範囲を要約」
2. シェルコマンドを定義
- 以下のコマンドをコピー&ペーストしてください。
【コマンドの解説】
gemini prompt "..."
: Geminiにプロンプト(指示)を送る基本コマンドです。以下の文章を3点に要約してください。n---n
: これがAIへの具体的な指示(プロンプト)です。n
は改行を意味し、指示と本文を明確に分離しています。{{selection}}
: ここが最重要ポイントです。 Shell Commandsプラグインの特殊な変数で、Obsidianエディタで「現在選択しているテキスト」が自動的にここに挿入されます。
3. 出力先を設定
- 「Output」のドロップダウンリストから「Replace current selection」を選択します。これにより、要約結果が元の選択範囲を置き換える形で出力されます。
4. アイコンとホットキー(推奨)
- コマンドパレットから実行しやすくするために、左側のアイコンボタンから好きなアイコンを選びましょう。
- さらに、このコマンドを瞬時に呼び出すためにホットキーを設定します。「設定」→「ホットキー」で、先ほど付けたコマンド名(「Gemini: 選択範囲を要約」)を検索し、
Cmd+Shift+S
のような好きなキーの組み合わせを割り当てます。
これで、あなたの最初のGemini連携コマンドが完成しました!
Obsidianのノート上で適当な文章を選択し、設定したホットキーを押してみてください。数秒後、選択した文章が簡潔な要約に置き換われば、すべて成功です。
実践的ユースケース:明日から使えるGemini CLI活用術
基本の連携ができたところで、さらに実践的なコマンドの例をいくつか紹介します。これらを参考に、自分だけのコマンド集を作り上げてください。
1. 多言語翻訳
出力先: Replace current selection
2. 文章のトーンを変更(よりフォーマルに)
出力先: Replace current selection
3. アイデアの壁打ち(ブレインストーミング)
出力先: Insert at cursor position (カーソル位置に出力)
4. マークダウンテーブルの生成
出力先: Replace current selection
5. 複雑な正規表現の生成
出力先: Insert at cursor position
6. コードの解説(リファクタリング提案)
出力先: Append to current file (ファイルの末尾に追記)
さらなる高みへ:応用テクニックと注意点
コスト管理とモデルの選択
Gemini APIの利用は無料枠を超えると有料になります。個人での利用であれば、無料枠内で収まることがほとんどですが、念のためGoogle Cloudの請求コンソールで利用状況を時々確認する習慣をつけましょう。
また、Geminiには複数のモデルがあります。gemini-1.5-flash
は高速で安価、gemini-1.5-pro
は高性能です。デフォルトはProですが、速度を重視する場合はFlashモデルを指定することも可能です。
プロンプトの改善
AIの出力品質は、プロンプト(指示)の質に大きく依存します。より良い結果を得るために、以下のような工夫を試してみてください。
- 役割を与える: 「あなたはプロの編集者です。」のように役割を指定する。
- 出力形式を指定する: 「箇条書きで」「JSON形式で」のようにフォーマットを指示する。
- 思考プロセスを記述させる: 「まずステップバイステップで考え、最後に出力してください。」と指示すると、複雑なタスクの精度が上がることがあります。
まとめ:Gemini CLIは、あなたの知的生産を加速させる「触媒」である
ObsidianとGemini CLIの連携は、単なる「AI機能の追加」ではありません。それは、あなたの思考プロセスそのものをハックし、知的生産のサイクルを、かつてないほど高速かつシームレスにするための**「環境構築」**です。
GUIの安易な便利さに流されることなく、CUIの持つ透明性、制御性、拡張性を選択したあなただからこそ、この連携の真価を最大限に引き出すことができるでしょう。
今回紹介したのは、ほんの始まりに過ぎません。ここから先は、あなたが自身のワークフローに合わせてコマンドを育て、自分だけの「最強の第二の脳」を構築していく旅路です。
さあ、今すぐターミナルを開き、あなたのObsidianに新しい知性をインストールしましょう。