Představte si svět, kde k používání té nejšpičkovější umělé inteligence nepotřebujete drahé předplatné, bleskové připojení k internetu, a hlavně – kde nemusíte svá data posílat na servery technologických gigantů. Ten svět právě dorazil. Google DeepMind vypustil do světa Gemma 4, svou dosud nejvýkonnější rodinu otevřených modelů (open models), které v mnoha ohledech zahanbují i mnohonásobně větší konkurenty.
Pokud sledujete web aidatabaze.cz, víte, že se v AI světě pořád něco děje. Ale tohle není jen „další model v řadě“. Gemma 4 je milník, který začíná stírat rozdíl mezi obří cloudovou AI a tím, co vám běží v kapse na iPhonu nebo Androidu.
Co je Gemma 4 a proč mění pravidla hry?
Gemma 4 není postavená „na zelené louce“. Vychází ze stejného špičkového výzkumu a technologií jako Gemini 3, vlajková loď Googlu. Vývojářská komunita si modely Gemma doslova zamilovala – od spuštění první generace zaznamenaly přes 400 milionů stažení a vzniklo více než 100 000 jejich variant.
V čem je Gemma 4 jiná? V neuvěřitelné efektivitě. Google se zaměřil na tzv. intelligence-per-parameter. To znamená, že model s méně parametry dokáže uvažovat stejně chytře jako dřívější modely, které byly desetkrát nebo dvacetkrát větší.
Čtyři verze pro každou situaci:
- Effective 2B (E2B): Prcek pro mobily a prohlížeče, který vás šokuje svou rychlostí.
- Effective 4B (E4B): Ideální balanc mezi výkonem a spotřebou baterie pro mobilní zařízení.
- 26B Mixture of Experts (MoE): Mistr v efektivitě. Má sice 26 miliard parametrů, ale při každém úkolu jich aktivuje jen 3,8 miliardy. Výsledek? Brutální rychlost generování textu.
- 31B Dense: Absolutní špička. Tento model aktuálně drží 3. místo na světě v prestižním žebříčku Arena AI text leaderboard mezi open-source modely. Poráží modely, které jsou i 20x větší!

V čem je tento model naprosto „super“?
Pokud si myslíte, že Gemma 4 je jen lepší chatovací robot, pletete se. Je to multimodální mozek, který zvládá úkoly, na které dříve stačily jen placené modely jako GPT-4.
- Pokročilé uvažování (Reasoning): Gemma 4 exceluje v logice a matematice. Dokáže plánovat v několika krocích a řešit komplexní zadání.
- Agentické schopnosti: Tohle je budoucnost. Model nativně podporuje volání funkcí (function-calling) a strukturovaný JSON výstup. To znamená, že ho můžete propojit se svým kalendářem, e-mailem nebo chytrou domácností a on za vás bude vykonávat reálné úkoly.
- Obří paměť (Context Window): Už žádné zapomínání uprostřed rozhovoru. Mobilní modely mají okno 128K tokenů, ty větší dokonce 256K tokenů. Do jednoho promptu tak můžete nahrát celou knihu nebo kompletní zdrojový kód aplikace a ptát se na detaily.
- Multilingvismus: Gemma 4 byla trénována na více než 140 jazycích. Čeština jí jde skvěle, což nebývá u menších open-source modelů pravidlem.
Svoboda jménem Apache 2.0: Stáhněte si ji a upravte!
Jednou z největších zpráv je licence. Gemma 4 je šířena pod licencí Apache 2.0. Co to znamená pro vás?
Vše je zdarma a vaše. Model si můžete stáhnout, používat ho pro komerční účely, a hlavně si ho můžete dotrénovat (fine-tune) na vlastních datech.
Chcete model, který mluví jako právník, nebo experta na diagnózu vzácných chorob? Díky nástrojům jako Unsloth nebo Keras to dnes zvládnete i na herním notebooku. Google už spolupracoval například s Yale University na modelu pro výzkum rakoviny nebo s bulharským INSAIT na národním modelu BgGPT. S Gemmou 4 máte tuhle sílu v rukou i vy.
Hardware: Co budete potřebovat?
Aby vám model běžel hladce, musíte zvolit správnou verzi podle vaší operační paměti (RAM) nebo grafické paměti (VRAM). Tady je přehledná tabulka nároků pro různé úrovně kvantizace (zjednodušení modelu pro nižší nároky):
Paměťové nároky Gemma 4 (Inference)
| Model | BF16 (Plná kvalita) | SFP8 (8-bit) | Q4_0 (4-bit – doporučeno) |
| Gemma 4 E2B | 9.6 GB | 4.6 GB | 3.2 GB |
| Gemma 4 E4B | 15 GB | 7.5 GB | 5 GB |
| Gemma 4 26B MoE | 48 GB | 25 GB | 15.6 GB |
| Gemma 4 31B Dense | 58.3 GB | 30.4 GB | 17.4 GB |
Poznámka: Pro běh na mobilu míříme na verzi E2B nebo E4B v 4-bitové kvantizaci, což hravě zvládne každý modernější smartphone.
Jak rozběhnout Gemma 4 lokálně na vašem zařízení?
Tohle je ta nejlepší část. Žádné API klíče, žádné odesílání dat do Googlu. Vše běží přímo ve vašem procesoru a grafickém čipu.
1. iPhone (Pomocí aplikace Locally AI)
Pro majitele iPhonů je nejsnadnější cestou aplikace Locally AI (dostupná v App Store).
- Stáhněte si aplikaci Locally AI.
- V sekci „Models“ vyhledejte Gemma 4 E2B nebo E4B.
- Klikněte na „Download“.
- Jakmile se model stáhne, můžete vypnout Wi-Fi i mobilní data a začít chatovat.
Tip: Na novějších iPhonech (řada 15 Pro a vyšší) běží model E2B naprosto bleskově díky výkonnému Neural Engine.
2. Android
Na Androidu je situace ještě zajímavější. Google úzce spolupracuje s výrobci jako Qualcomm a MediaTek.
- AICore: Pokud máte telefon Google Pixel nebo špičkový Samsung, Gemma 4 je integrována přímo do systému skrze AICore. Vývojáři ji mohou volat v rámci svých aplikací.
- ML Kit: Běžní uživatelé brzy uvidí aplikace využívající ML Kit GenAI Prompt API, které umožní běh Gemmy 4 na pozadí téměř jakékoli aplikace.
- Termux/Ollama: Pro pokročilé uživatele lze Gemma 4 spustit i přes terminál Termux pomocí projektu Ollama.
3. PC a Mac
Pokud máte Mac s čipem M1/M2/M3/M4 nebo PC s grafickou kartou NVIDIA, doporučujeme nástroje jako LM Studio nebo Ollama. Stačí zadat ollama run gemma4 a během okamžiku máte na počítači jeden z nejchytřejších modelů světa.
Závěr: Proč byste ji měli zkusit?
Gemma 4 je symbolem digitální suverenity. Je to důkaz, že špičková umělá inteligence nemusí být uzamčena za zdí měsíčních poplatků. Ať už jste vývojář, který chce stavět autonomní agenty, nebo jen nadšenec, který chce mít chytrého asistenta vždy po ruce (i v letadle v režimu offline), Gemma 4 je pro vás jasnou volbou.
Stáhněte si ji, vyzkoušejte ji a uvidíte sami – budoucnost AI je otevřená, lokální a neuvěřitelně výkonná. A co je na tom nejlepší? Máte ji v kapse právě teď.

Komentáre