Pixubus EX — Ollama の ~800px の壁を llama.cpp で越え、キャラ画像を細部まで読んで Stable Diffusion プロンプトを作るローカルツール

Pixubus EX のキービジュアル。800pxの壁、こえる。Gemma4 を、限界まで。Ollama → llama.cpp で、キャラ画像を細部まで読んで SD プロンプトに。
1120
画像トークン予算
(Ollama は 280 で頭打ち)
~1600px
読み込む長辺
(Ollama は ~800px)
0
クラウド送信
(完全ローカル)

なぜ Pixubus EX?

Ollama で Gemma4 に画像を渡すと、内部で約 0.65MP(~803×803)に縮められます(画像トークンが 280 に固定)。だから髪飾り・小物・細かい柄・小さな文字を取りこぼし、ときに幻覚します。

Pixubus EX は llama.cpp を直接駆動して --image-max-tokens 1120(Gemma4 の OCR 予算)を渡し、同じ Gemma4 で約 2 倍小さい文字・細部まで読みます(長辺 ~1606px・最大 2.58MP)。= 「Ollama の壁を越えて、Gemma4 を限界まで引き出す上位版」

Ollama × Gemma4Pixubus EX(llama.cpp)
画像トークン280 で固定1120(可変)
実質の解像度~0.65MP(≈803px)~2.58MP(長辺 ~1606px)
小さな文字・細部つぶれて幻覚しがち読める

※ この壁は「Ollama × Gemma4」の組み合わせ固有の挙動です(他の vision モデルは別の方式)。数値は 2026-06 の実測時点。検証の詳細は配布物の research/ に同梱。

できること

🔍~800px の壁を越えるOllama が縮める制約を llama.cpp で回避。image-max-tokens 1120 で細部まで読む。
🪜2ステップで完結STEP 01 抽出(画像 → 外見タグ)→ STEP 02 生成(タグ + 状況 → positive / negative)。
✂️賢いトリミング原寸で切ってから、はみ出すときだけ縮小。背景を切ってキャラを大きく送れる。
🔌llama-server 2モードmanaged(アプリが起動)/ connect(URL 接続)。別 PC・クラウド GPU にも。
🗂ジョブ・履歴ブラウザを閉じても継続・再アタッチ。履歴は復元・★お気に入り・コピー。
📴完全ローカル・検閲なしセットアップ後は外部に出ない。題材も表現も思いのまま、手元で完結。

動作条件

手元の PC で動くローカルアプリです。下の3つをそろえれば動きます。GPU があれば速く、無くても CPU で動きます。

対応 OSWindowsmacOSLinux

1アプリ本体中核
  • Node.js 24 以降
  • 配布物(zip)+ ブラウザ
2llama.cpp + モデル頭脳
  • llama-server(OS 別に入手・同梱なし)
  • Gemma4 の GGUF + mmproj
  • GPU 推奨(無ければ CPU で遅め)
速さ優先 = 12B、精度優先 = 31B(遅くても可)。 NVIDIA GPU は CUDA 12.4 ビルド推奨。入手は 使い方ガイド に OS 別で詳しく。

ローカルだから、創作は自由

解析もプロンプトも、すべてあなたの PC の中だけ。クラウドに送らないから、題材も表現も思いのまま。外部サービスのフィルタや検閲に縛られず、描きたい世界をそのまま形にできます。難しいタグや英語を覚えなくても、手持ちのキャラ画像と日本語の「こうしたい」から始められます。

本家 Pixubus との違い

Pixubus EX は 本家 Pixubus(Ollama + ComfyUI で画像生成まで行う版)の姉妹プロダクト。こちらは llama.cpp に特化し、Ollama の解像度の壁を越えて 「画像を細部まで読む」 ことに振り切った Extended(上位)版です。出力は プロンプトまで — 画像生成はお好みの環境で。

手に入れる

配布は note のメンバーシップから。最新版の入手とアップデートに対応します。

このサイトは配布物に同梱(オフラインでも閲覧可)。アプリ起動中は画面右上の「使い方 ↗」からも開けます。