Local-first · llama.cpp · Gemma4
Pixubus EX
キャラ画像を、細部まで読む。
Ollama の ~800px の壁を
1120
画像トークン予算
(Ollama は 280 で頭打ち)
(Ollama は 280 で頭打ち)
~1600px
読み込む長辺
(Ollama は ~800px)
(Ollama は ~800px)
0
クラウド送信
(完全ローカル)
(完全ローカル)
準備は3ステップ
用意するのは 3つ。①アプリ本体、②頭脳になる llama.cpp、③そこに読ませる モデル。順にそろえれば動きます。
1
アプリ本体を起動Node.js 24+ を入れて
npm ci && npm start → ブラウザで開く。→ はじめに
2
llama.cpp を用意OS ごとに
llama-server を入手(Win / mac / Linux)。→ llama.cpp の準備
②と③が少しだけ手間です。このサイトでは OS 別に画面の手順を用意したので、当てはまるところだけ読めば大丈夫。
できること
🔍~800px の壁を越えるOllama が画像を縮めてしまう制約を llama.cpp で回避。
--image-max-tokens 1120 で細部まで読む。🪜2ステップで完結STEP 01 抽出(画像 → 外見タグ)→ STEP 02 生成(タグ + 状況 → positive / negative)。
🔌llama-server 2モードmanaged(アプリが起動)/ connect(URL 接続)。別 PC・クラウド GPU にもつなげる。
✂️賢いトリミング原寸で切ってから、はみ出すときだけ縮小。背景を切ってキャラを大きく送れる。
📴完全オフラインセットアップ後は外部サービスにつながらない。画像もプロンプトも外に出ない。
🗂ジョブ・履歴ブラウザを閉じても継続・再アタッチ。履歴は復元・★お気に入り・コピー。
動作条件 — 必要なもの
Pixubus EX は手元の PC で動くローカルアプリ。下の3つをそろえれば動きます。GPU があれば速く、無くても CPU で動きます。
対応 OSWindowsmacOSLinux
1アプリ本体中核
- Node.js 24 以降(履歴 DB に組み込み SQLite)
- 配布物(zip)を展開したフォルダ
- ブラウザ(Chrome 等)
2llama.cpp + モデル頭脳
- llama-server(OS 別に入手・同梱なし)
- Gemma4 の GGUF + mmproj
- GPU 推奨(無ければ CPU で遅めに動作)
速さ優先 = 12B、精度優先 = 31B(遅くても可)。 NVIDIA GPU は CUDA 12.4 ビルド推奨(Blackwell/RTX 50 系も)。詳しくは llama.cpp の準備 と 速度の目安。
ガイド
🧭はじめに(準備の全体像)必要なもの・起動・初回設定。まずここから。
⚙️llama.cpp の準備(OS別)Windows / macOS / Linux で
llama-server を入手。
📦モデルの入手と設置Gemma4 の GGUF と mmproj をどこから・どこに。
📖基本の使い方抽出 → 生成。トリミング・履歴・ジョブ。
🔌設定(LLM 接続)managed / connect、画像予算・GPU・温度。
⏱速度の目安12B / 31B、CPU / GPU の実測例。
🛠トラブルシュート起動時クラッシュ・接続できない・遅い 等。
🧩仕組み(構成)ブラウザ → サーバー → llama-server を図で。
📑画面と用語mmproj / image-max-tokens / ngl など。
このサイトは アプリを起動していなくても 読めます(完全オフライン)。アプリ起動中は画面右上の 「使い方 ↗」(
/docs)からも。
本家 Pixubus との違い
Pixubus EX は 本家 Pixubus(Ollama + ComfyUI で画像生成まで行う版)の姉妹プロダクト。こちらは llama.cpp に特化し、Ollama の解像度の壁を越えて画像を細部まで読ませることに振り切った「Extended(上位)」版です。出力は プロンプトまで — 画像生成はお好みの環境で。