ホーム / 使い方(目次)
使い方ガイド
セットアップから各機能・トラブルシュートまで。はじめての方は 「準備の全体像」→「llama.cpp の準備」→「モデルの入手」 の順がおすすめです。
準備は3ステップ
動かすまでに用意するのは 3つ。①アプリ本体、②頭脳になる llama.cpp、③そこに読ませる モデル。順にそろえれば動きます。
1
アプリ本体を起動Node.js 24+ を入れて
npm ci && npm start → ブラウザで開く。→ はじめに
2
llama.cpp を用意OS ごとに
llama-server を入手(Win / mac / Linux)。→ llama.cpp の準備
②と③が少しだけ手間です。OS 別に画面の手順を用意したので、当てはまるところだけ読めば大丈夫。
ガイド一覧
🧭はじめに(準備の全体像)必要なもの・アプリの起動・初回の設定。まずここから。
⚙️llama.cpp の準備(OS別)Windows / macOS / Linux ごとに
llama-server を入手。
📦モデルの入手と設置Gemma4 の GGUF と mmproj をどこから・どこに。HF 直 DL と Ollama 流用。
📖基本の使い方STEP 01 抽出 → STEP 02 生成。トリミング・履歴・ジョブ。
🔌設定(LLM 接続)managed / connect、画像トークン予算・GPU・温度。
⏱速度の目安12B と 31B、CPU と GPU(本 PoC の実測例)。
🛠トラブルシュート起動直後にクラッシュ・接続できない・遅い 等。
💾バックアップnpm run backup で履歴・設定・入力画像を 1 つの zip に。
📑画面と用語mmproj / image-max-tokens / ngl / QAT / anima タグ など。
🧩仕組み(構成)ブラウザ → サーバー → llama-server。なぜ ~800px の壁を越えられるのか。
🗒変更履歴各バージョンの新機能と変更点。
このガイドは アプリを起動していなくても 読めます(完全オフライン)。アプリ起動中は画面右上の 「使い方 ↗」(
/docs)からも開けます。