Zen AI Model Family

Hypermodal AI

41 models across 8 families. Open-weight AI covering text, vision, image, audio, code, embeddings, and reranking — from edge to frontier.

41

AI Models

8

Model Families

7

Modalities

Apache 2.0

License

Zen 5 — Next Generation

Fifth-generation agentic models with MoDE (Mixture of Distilled Experts) and native chain-of-thought reasoning

zen5

Research Preview

Agentic frontier model with native chain-of-thought

TextCodeReasoningAgentsCoT

1M+ contextMoDE + CoT

zen5-pro

Research Preview

High-throughput agentic model for production

TextCodeReasoningProduction

512K contextMoDE + CoT

zen5-max

Research Preview

Maximum context for document-scale analysis

TextLong ContextAnalysisReasoning

2M contextMoDE + CoT

zen5-ultra

Research Preview

Deepest reasoning with self-verification

TextCodeDeep ReasoningVerification

1M contextMoDE + Deep CoT

zen5-mini

Research Preview

Efficient agentic model, zen5-class intelligence

TextCodeAgentsEfficient

256K contextMoDE + CoT

Zen 4 — Flagship

Fourth-generation flagship models with MoE architecture, long context, and state-of-the-art benchmarks

zen4

744B MoE (40B active)

Flagship model for complex reasoning

TextCodeMathReasoning

202K contextMoE

zen4-ultra

744B MoE (40B active)

Maximum reasoning with chain-of-thought

TextCodeReasoningThinking

262K contextMoE + CoT

zen4-pro

80B MoE (3B active)

High-capability efficient MoE

TextCodeReasoningTools

131K contextMoE

zen4-max

Most capable model, agentic tasks

TextCodeReasoningAgentsFrontier

1M contextDense

zen4.6

Extended context, cost efficient

TextCodeLong ContextEfficient

1M contextDense

zen4-mini

Ultra-fast, free tier

TextCodeMathFree Tier

128K contextDense

zen4-thinking

80B MoE (3B active)

Dedicated reasoning

TextReasoningThinkingCoT

131K contextMoE + CoT

Zen 4 Coder

Specialized code models for software engineering, generation, review, and debugging

zen4-coder

480B MoE (35B active)

Code generation, review, debugging

CodeAgentsToolsAgentic

163K contextMoE

zen4-coder-pro

480B Dense BF16

Full-precision code analysis

CodePrecisionDeep Reasoning

131K contextDense BF16

zen4-coder-flash

30B MoE (3B active)

Fast inline completions

CodeCompletionsFastReal-time

262K contextMoE

Zen 3 — Multimodal

Third-generation multimodal models spanning text, vision, audio, and safety

zen3-omni

~200B Dense Multimodal

Text, vision, audio

TextVisionAudioMultimodal

202K contextDense Multimodal

zen3-vl

30B MoE (3B active)

Vision-language

VisionLanguageOCRVQA

262K contextMoE

zen3-nano

Edge deployment, free tier

TextCodeEdgeFree Tier

128K contextDense

zen3-guard

Content safety, 119 languages

SafetyModeration119 Languages

65K contextDense

Zen 3 Image

Diffusion models for image generation, editing, and creative workflows

zen3-image

Best general-purpose image generation

Text-to-ImageArtPhotography

Text-to-ImageDiffusion

zen3-image-max

Maximum quality, professional creative

Max QualityProfessionalCreative

Text-to-ImageDiffusion

zen3-image-dev

Development and iteration

DevelopmentIterationFast

Text-to-ImageDiffusion

zen3-image-fast

Real-time generation

Real-timeFastLow Latency

Text-to-ImageDiffusion

zen3-image-sdxl

1024px high-resolution

1024pxHigh-resSDXL

Text-to-ImageDiffusion

zen3-image-playground

Aesthetic artistic generation

AestheticArtisticCreative

Text-to-ImageDiffusion

zen3-image-ssd

Fastest diffusion model

FastestSSDReal-time

Text-to-Image1B Diffusion

zen3-image-jp

Japanese-specialized

JapaneseSpecializedLocalized

Text-to-ImageDiffusion

Zen 3 Audio & Speech

Transcription, text-to-speech, real-time ASR, and broadcast-quality audio

zen3-audio

100+ language transcription

ASR100+ LanguagesTranscription

zen3-audio-fast

Fastest transcription

ASRFastReal-time

zen3-asr

Real-time <500ms latency

StreamingReal-time<500ms

<500ms latencyStreaming ASR

zen3-asr-v1

Legacy compatibility

StreamingLegacyCompatible

StreamingStreaming ASR

zen3-tts

40+ voices, 8 languages

TTS40+ Voices8 Languages

zen3-tts-hd

Broadcast-quality 48kHz

TTS48kHzBroadcast Quality

48kHz TTSTTS HD

zen3-tts-fast

Low-latency voice agents

TTSLow LatencyVoice Agents

Low-latency TTS82M

Zen 3 Embedding

Dense embeddings for semantic search, RAG, classification, and retrieval

zen3-embedding

3072 dimensions

RAG, search, classification

EmbeddingsRAGSearchClassification

8K context3072d

zen3-embedding-medium

Cost-effective retrieval

EmbeddingsRetrievalCost-effective

zen3-embedding-small

High-throughput

EmbeddingsHigh-throughputLightweight

32K context0.6B

zen3-embedding-openai

3072 dimensions

OpenAI-compatible drop-in

EmbeddingsOpenAI-compatibleDrop-in

8K context3072d

Zen 3 Reranker

Cross-encoder rerankers for improving search and RAG pipeline accuracy

zen3-reranker

RAG pipeline accuracy

RerankingRAGSearchAccuracy

zen3-reranker-medium

Cost-effective reranking

RerankingCost-effectiveBalanced

zen3-reranker-small

High-throughput minimal cost

RerankingHigh-throughputMinimal Cost

40K context0.6B

Capabilities Matrix

Each model specializes in different modalities and tasks

Model	Text	Image	Video	Audio	3D	Code	Agents
zen5	✓	—	—	—	—	✓	✓
zen4	✓	—	—	—	—	✓	✓
zen4-max	✓	—	—	—	—	✓	✓
zen4-ultra	✓	—	—	—	—	✓	✓
zen4-coder	✓	—	—	—	—	✓	✓
zen3-omni	✓	✓	—	✓	—	—	—
zen3-vl	✓	✓	—	—	—	—	—
zen3-nano	✓	—	—	—	—	✓	—
zen3-guard	✓	—	—	—	—	—	—
zen3-image	✓	✓	—	—	—	—	—
zen3-audio	✓	—	—	✓	—	—	—
zen3-tts	✓	—	—	✓	—	—	—
zen3-embedding	✓	—	—	—	—	—	—
zen3-reranker	✓	—	—	—	—	—	—

Infrastructure

Production-ready tools for training and deploying Zen models

Hanzo Engine

High-performance cloud inference — 60+ architectures, CUDA/Metal, OpenAI-compatible API

Hanzo Edge

On-device AI inference — run models locally on any device, browser, or embedded system

Zen Gym

Unified training platform for all Zen models with LoRA, QLoRA, GRPO, and more

Hanzo MCP

Model Context Protocol for AI context management and tool use

Quick Start

Get started with any Zen model in seconds

# Install and run any model
pip install transformers torch

# Use directly
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("zenlm/zen-eco-4b-instruct")
tokenizer = AutoTokenizer.from_pretrained("zenlm/zen-eco-4b-instruct")

# Or use via Hanzo Cloud API
from hanzoai import Hanzo
client = Hanzo(api_key="hk-your-api-key")

response = client.chat.completions.create(
    model="zen-eco-4b-instruct",
    messages=[{"role": "user", "content": "Hello!"}]
)

Build with Zen AI

Open-weight models, Apache 2.0 licensed. Free to use for research and commercial applications.