Nebius Token Factory

Access 21 Nebius Token Factory models through Mastra's model router. Authentication is handled automatically using the NEBIUS_API_KEY environment variable.

Learn more in the Nebius Token Factory documentation.

.env
NEBIUS_API_KEY=your-api-key

src/mastra/agents/my-agent.ts
import { Agent } from "@mastra/core/agent";

const agent = new Agent({
  id: "my-agent",
  name: "My Agent",
  instructions: "You are a helpful assistant",
  model: "nebius/MiniMaxAI/MiniMax-M2.5"
});

// Generate a response
const response = await agent.generate("Hello!");

// Stream a response
const stream = await agent.stream("Tell me a story");
for await (const chunk of stream) {
  console.log(chunk);
}

info

Mastra uses the OpenAI-compatible /chat/completions endpoint. Some provider-specific features may not be available. Check the Nebius Token Factory documentation for details.

Models
Direct link to Models

21 available models
Model	Context	Input $/1M	Output $/1M
`nebius/deepseek-ai/DeepSeek-V4-Pro`	1.0M	$2	$4
`nebius/google/gemma-3-27b-it`	110K	$0.10	$0.30
`nebius/meta-llama/Llama-3.3-70B-Instruct`	128K	$0.13	$0.40
`nebius/MiniMaxAI/MiniMax-M2.5`	197K	$0.30	$1
`nebius/MiniMaxAI/MiniMax-M3`	1.0M	$0.30	$1
`nebius/moonshotai/Kimi-K2.7-Code`	262K	$0.95	$4
`nebius/NousResearch/Hermes-4-405B`	128K	$1	$3
`nebius/NousResearch/Hermes-4-70B`	128K	$0.13	$0.40
`nebius/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1`	128K	$0.60	$2
`nebius/nvidia/Nemotron-3-Nano-Omni`	66K	$0.06	$0.24
`nebius/nvidia/nemotron-3-super-120b-a12b`	256K	$0.30	$0.90
`nebius/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B`	32K	$0.06	$0.24
`nebius/openai/gpt-oss-120b`	128K	$0.15	$0.60
`nebius/Qwen/Qwen2.5-VL-72B-Instruct`	128K	$0.25	$0.75
`nebius/Qwen/Qwen3-235B-A22B-Instruct-2507`	262K	$0.20	$0.60
`nebius/Qwen/Qwen3-30B-A3B-Instruct-2507`	128K	$0.10	$0.30
`nebius/Qwen/Qwen3-32B`	128K	$0.10	$0.30
`nebius/Qwen/Qwen3-Embedding-8B`	33K	$0.01	—
`nebius/Qwen/Qwen3-Next-80B-A3B-Thinking`	128K	$0.15	$1
`nebius/Qwen/Qwen3.5-397B-A17B`	262K	$0.60	$4
`nebius/zai-org/GLM-5.2`	432K	$1	$4

Advanced configuration
Direct link to Advanced configuration

Custom headers
Direct link to Custom headers

src/mastra/agents/my-agent.ts
const agent = new Agent({
  id: "custom-agent",
  name: "custom-agent",
  model: {
    url: "https://api.tokenfactory.nebius.com/v1",
    id: "nebius/MiniMaxAI/MiniMax-M2.5",
    apiKey: process.env.NEBIUS_API_KEY,
    headers: {
      "X-Custom-Header": "value"
    }
  }
});

Dynamic model selection
Direct link to Dynamic model selection

src/mastra/agents/my-agent.ts
const agent = new Agent({
  id: "dynamic-agent",
  name: "Dynamic Agent",
  model: ({ requestContext }) => {
    const useAdvanced = requestContext.task === "complex";
    return useAdvanced
      ? "nebius/zai-org/GLM-5.2"
      : "nebius/MiniMaxAI/MiniMax-M2.5";
  }
});

ModelsDirect link to Models

Advanced configurationDirect link to Advanced configuration

Custom headersDirect link to Custom headers

Dynamic model selectionDirect link to Dynamic model selection

Models
Direct link to Models

Advanced configuration
Direct link to Advanced configuration

Custom headers
Direct link to Custom headers

Dynamic model selection
Direct link to Dynamic model selection