
変更したこと
これまでアプリの中からしか使えなかった画像・音声・動画の生成機能を、外部から呼べるAPIとして公開しました。エンドポイントは3本です。
・POST /api/v1/images/generations — 画像生成(同期、1024² / 20stepsで約4秒)
・POST /api/v1/audio/generations — 音声合成(同期、最初の音声まで約85〜120ms)
・POST /api/v1/videos/generations — 動画生成(非同期ジョブ、約60〜90秒)
認証はBearerトークン1本。リクエストの形はOpenAI互換に寄せたので、既存のクライアントから移しやすいです。
使用例(↓ この curl だけコードブロックにする):
使いやすくなったところ
APIキーがセルフ発行になりました。問い合わせも審査も不要で、「API管理」ページにプロジェクト名を入れて発行するだけ。平文キーは発行直後の1回だけ表示され(保存はハッシュのみ)、漏れたら失効して再発行できます。
全レスポンスに応答速度(実測ミリ秒)が入ります。「速い」と言葉で書く代わりに、毎回の応答に実測値を載せました。速さは自分の目で確かめてもらえます。
無料枠は画像・音声それぞれ1日10回(動画は別クォータ)。課金はアプリ側の既存の残高・クォータにそのまま乗るので、API用に別アカウントを作る必要はありません。
発行・利用制限:
使い方・リファレンス:
次に実現したい機能
次は kotonia-cli をリリース予定です。Claude Code のように、ターミナルから対話で生成を回せる CLI ツールです。
今回のAPIを土台にして、画像・音声・動画の生成をコマンド1つから叩けるようにする予定。「キーを発行 → kotonia-cliを入れる → そのまま生成」までを最短にして、curlを手で組まなくても使い始められる状態を目指します。
