ホーム / 使い方(目次)

使い方ガイド

セットアップから各機能・トラブルシュートまで。はじめての方は 「準備の全体像」→「llama.cpp の準備」→「モデルの入手」 の順がおすすめです。

準備は3ステップ

動かすまでに用意するのは 3つ。①アプリ本体、②頭脳になる llama.cpp、③そこに読ませる モデル。順にそろえれば動きます。

1 アプリ本体を起動Node.js 24+ を入れて npm ci && npm start → ブラウザで開く。→ はじめに

2 llama.cpp を用意OS ごとに llama-server を入手(Win / mac / Linux)。→ llama.cpp の準備

3 モデルを置いて接続Gemma4 の GGUF + mmproj を入手し、設定でつなぐ。→ モデルの入手 / 設定

②と③が少しだけ手間です。OS 別に画面の手順を用意したので、当てはまるところだけ読めば大丈夫。

ガイド一覧

🧭はじめに(準備の全体像)必要なもの・アプリの起動・初回の設定。まずここから。 ⚙️llama.cpp の準備(OS別)Windows / macOS / Linux ごとに llama-server を入手。 📦モデルの入手と設置Gemma4 の GGUF と mmproj をどこから・どこに。HF 直 DL と Ollama 流用。 📖基本の使い方STEP 01 抽出 → STEP 02 生成。トリミング・履歴・ジョブ。 🔌設定(LLM 接続)managed / connect、画像トークン予算・GPU・温度。 ⏱速度の目安12B と 31B、CPU と GPU(本 PoC の実測例)。 🛠トラブルシュート起動直後にクラッシュ・接続できない・遅い等。 💾バックアップnpm run backup で履歴・設定・入力画像を 1 つの zip に。 📑画面と用語mmproj / image-max-tokens / ngl / QAT / anima タグなど。 🧩仕組み(構成)ブラウザ → サーバー → llama-server。なぜ ~800px の壁を越えられるのか。 🗒変更履歴各バージョンの新機能と変更点。

このガイドは アプリを起動していなくても 読めます(完全オフライン)。アプリ起動中は画面右上の 「使い方 ↗」(/docs)からも開けます。