Local-first · llama.cpp · Gemma4

Pixubus EX
キャラ画像を、細部まで読む。

Ollama の ~800px の壁llama.cpp で越える上位版。Gemma4 の画像トークン予算をフルに引き出し、髪飾りや小さなボタンまで読んでプロンプトにします。すべて手元のローカルで。

1120
画像トークン予算
(Ollama は 280 で頭打ち)
~1600px
読み込む長辺
(Ollama は ~800px)
0
クラウド送信
(完全ローカル)
Pixubus EX のマスコット — 全力疾走するジャーマンシェパード(日本アニメ風)

準備は3ステップ

用意するのは 3つ。①アプリ本体、②頭脳になる llama.cpp、③そこに読ませる モデル。順にそろえれば動きます。

1 アプリ本体を起動Node.js 24+ を入れて npm ci && npm start → ブラウザで開く。→ はじめに
2 llama.cpp を用意OS ごとに llama-server を入手(Win / mac / Linux)。→ llama.cpp の準備
3 モデルを置いて接続Gemma4 の GGUF + mmproj を入手し、設定でつなぐ。→ モデルの入手 / 設定

②と③が少しだけ手間です。このサイトでは OS 別に画面の手順を用意したので、当てはまるところだけ読めば大丈夫。

できること

🔍~800px の壁を越えるOllama が画像を縮めてしまう制約を llama.cpp で回避。--image-max-tokens 1120 で細部まで読む。
🪜2ステップで完結STEP 01 抽出(画像 → 外見タグ)→ STEP 02 生成(タグ + 状況 → positive / negative)。
🔌llama-server 2モードmanaged(アプリが起動)/ connect(URL 接続)。別 PC・クラウド GPU にもつなげる。
✂️賢いトリミング原寸で切ってから、はみ出すときだけ縮小。背景を切ってキャラを大きく送れる。
📴完全オフラインセットアップ後は外部サービスにつながらない。画像もプロンプトも外に出ない。
🗂ジョブ・履歴ブラウザを閉じても継続・再アタッチ。履歴は復元・★お気に入り・コピー。

動作条件 — 必要なもの

Pixubus EX は手元の PC で動くローカルアプリ。下の3つをそろえれば動きます。GPU があれば速く、無くても CPU で動きます。

対応 OSWindowsmacOSLinux

1アプリ本体中核
  • Node.js 24 以降(履歴 DB に組み込み SQLite)
  • 配布物(zip)を展開したフォルダ
  • ブラウザ(Chrome 等)
2llama.cpp + モデル頭脳
  • llama-server(OS 別に入手・同梱なし)
  • Gemma4 の GGUF + mmproj
  • GPU 推奨(無ければ CPU で遅めに動作)
速さ優先 = 12B、精度優先 = 31B(遅くても可)。 NVIDIA GPU は CUDA 12.4 ビルド推奨(Blackwell/RTX 50 系も)。詳しくは llama.cpp の準備速度の目安

ガイド

このサイトは アプリを起動していなくても 読めます(完全オフライン)。アプリ起動中は画面右上の 「使い方 ↗」(/docs)からも。

本家 Pixubus との違い

Pixubus EX は 本家 Pixubus(Ollama + ComfyUI で画像生成まで行う版)の姉妹プロダクト。こちらは llama.cpp に特化し、Ollama の解像度の壁を越えて画像を細部まで読ませることに振り切った「Extended(上位)」版です。出力は プロンプトまで — 画像生成はお好みの環境で。