なぜ Pixubus EX?
Ollama で Gemma4 に画像を渡すと、内部で約 0.65MP(~803×803)に縮められます(画像トークンが 280 に固定)。だから髪飾り・小物・細かい柄・小さな文字を取りこぼし、ときに幻覚します。
Pixubus EX は llama.cpp を直接駆動して --image-max-tokens 1120(Gemma4 の OCR 予算)を渡し、同じ Gemma4 で約 2 倍小さい文字・細部まで読みます(長辺 ~1606px・最大 2.58MP)。= 「Ollama の壁を越えて、Gemma4 を限界まで引き出す上位版」。
| Ollama × Gemma4 | Pixubus EX(llama.cpp) | |
|---|---|---|
| 画像トークン | 280 で固定 | 1120(可変) |
| 実質の解像度 | ~0.65MP(≈803px) | ~2.58MP(長辺 ~1606px) |
| 小さな文字・細部 | つぶれて幻覚しがち | 読める |
※ この壁は「Ollama × Gemma4」の組み合わせ固有の挙動です(他の vision モデルは別の方式)。数値は 2026-06 の実測時点。検証の詳細は配布物の research/ に同梱。
できること
image-max-tokens 1120 で細部まで読む。動作条件
手元の PC で動くローカルアプリです。下の3つをそろえれば動きます。GPU があれば速く、無くても CPU で動きます。
対応 OSWindowsmacOSLinux
- Node.js 24 以降
- 配布物(zip)+ ブラウザ
- llama-server(OS 別に入手・同梱なし)
- Gemma4 の GGUF + mmproj
- GPU 推奨(無ければ CPU で遅め)
ローカルだから、創作は自由
解析もプロンプトも、すべてあなたの PC の中だけ。クラウドに送らないから、題材も表現も思いのまま。外部サービスのフィルタや検閲に縛られず、描きたい世界をそのまま形にできます。難しいタグや英語を覚えなくても、手持ちのキャラ画像と日本語の「こうしたい」から始められます。
本家 Pixubus との違い
Pixubus EX は 本家 Pixubus(Ollama + ComfyUI で画像生成まで行う版)の姉妹プロダクト。こちらは llama.cpp に特化し、Ollama の解像度の壁を越えて 「画像を細部まで読む」 ことに振り切った Extended(上位)版です。出力は プロンプトまで — 画像生成はお好みの環境で。
手に入れる
配布は note のメンバーシップから。最新版の入手とアップデートに対応します。
このサイトは配布物に同梱(オフラインでも閲覧可)。アプリ起動中は画面右上の「使い方 ↗」からも開けます。