変更したこと

これまでアプリの中からしか使えなかった画像・音声・動画の生成機能を、外部から呼べるAPIとして公開しました。エンドポイントは3本です。

・POST /api/v1/images/generations — 画像生成（同期、1024² / 20stepsで約4秒）
・POST /api/v1/audio/generations — 音声合成（同期、最初の音声まで約85〜120ms）
・POST /api/v1/videos/generations — 動画生成（非同期ジョブ、約60〜90秒）

認証はBearerトークン1本。リクエストの形はOpenAI互換に寄せたので、既存のクライアントから移しやすいです。

使用例（↓ この curl だけコードブロックにする）:

使いやすくなったところ

APIキーがセルフ発行になりました。問い合わせも審査も不要で、「API管理」ページにプロジェクト名を入れて発行するだけ。平文キーは発行直後の1回だけ表示され（保存はハッシュのみ）、漏れたら失効して再発行できます。

全レスポンスに応答速度（実測ミリ秒）が入ります。「速い」と言葉で書く代わりに、毎回の応答に実測値を載せました。速さは自分の目で確かめてもらえます。

無料枠は画像・音声それぞれ1日10回（動画は別クォータ）。課金はアプリ側の既存の残高・クォータにそのまま乗るので、API用に別アカウントを作る必要はありません。

発行・利用制限:
使い方・リファレンス:

次に実現したい機能

次は kotonia-cli をリリース予定です。Claude Code のように、ターミナルから対話で生成を回せる CLI ツールです。

今回のAPIを土台にして、画像・音声・動画の生成をコマンド1つから叩けるようにする予定。「キーを発行 → kotonia-cliを入れる → そのまま生成」までを最短にして、curlを手で組まなくても使い始められる状態を目指します。

声で話せるAIキャラチャット — Kotonia | Kotonia

変更したこと

使いやすくなったところ

次に実現したい機能