Qwen Omni Turbo

Qwen

qwen/qwen-omni-turbo

Omni understanding: text+image+audio

Context Window

32K

32,000 tokens

Max Output

8,192 tokens

About this model

Qwen Omni Turbo is the Qwen multi-modal understanding model, supporting text, image, and audio input simultaneously.

Ideal for scenarios requiring cross-modal understanding. Access via Chuizi.AI with a ck- API key.

Highlights

Multi-modal

Text+image+audio

Fused understanding

General purpose

Best For

Multi-modal analysisAudio-visual understandingContent moderationCross-modal retrieval

2025-10-01

Capabilities

ChatVisionAudiotools

Pricing (per 1M tokens)

Pricing (per 1M tokens)	/ 1M tokens
Input / 1M	$2.10
Output / 1M	$6.30

Final prices shown

Quick Start

main.py

from openai import OpenAI

client = OpenAI(
    base_url="https://api.chuizi.ai/v1",
    api_key="ck-your-key-here",
)

response = client.chat.completions.create(
    model="qwen/qwen-omni-turbo",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(response.choices[0].message.content)

Qwen Omni Turbo

About this model

Highlights

Best For

Capabilities

Pricing (per 1M tokens)

Quick Start

FAQ

Related Models

Qwen Max

Qwen Plus

Qwen Turbo

Qwen2.5 Coder 32b

Qwen VL Max

Qwen3 Max

Qwen Omni Turbo

About this model

Highlights

Best For

Capabilities

Pricing (per 1M tokens)

Quick Start

FAQ

How do I get an API Key?

How does billing work?

What payment methods are supported?

Are there rate limits?

Related Models

Qwen Max

Qwen Plus

Qwen Turbo

Qwen2.5 Coder 32b

Qwen VL Max

Qwen3 Max