{"Qwen3.5-4B":{"provider":"silicon","real_model":"Qwen\/Qwen3.5-4B","type":"chat","icon":"🧠","description":"Qwen3.5-4B是通义千问的多模态模型，4B参数，轻量Dense架构。支持256K上下文（可扩至百万tokens），具备图文视频理解能力，同规模领先，超越GPT-5-Nano与Gemini-2.5-Flash-Lite。默认思考模式，支持工具调用及201种语言。"},"Qwen3-8B":{"provider":"silicon","real_model":"Qwen\/Qwen3-8B","type":"chat","icon":"🧠","description":"Qwen3-8B是通义千问最新模型，8.2B参数。支持思考与非思考模式无缝切换，强化推理能力，在数学、代码、逻辑推理上表现优异，且创意写作、角色扮演和多轮对话更符合人类偏好。支持100多种语言，翻译与指令遵循出色。"},"Qwen2.5-7B-Instruct":{"provider":"silicon","real_model":"Qwen\/Qwen2.5-7B-Instruct","type":"chat","icon":"🧠","description":"Qwen2.5-7B-Instruct是阿里云最新大语言模型，7B参数。在编码、数学等领域能力显著提升，支持29种以上语言（含中英文）。指令跟随、结构化数据理解和JSON输出生成均有大幅增强。"},"PaddleOCR-VL-1.5":{"provider":"silicon","real_model":"PaddlePaddle\/PaddleOCR-VL-1.5","type":"chat","icon":"📄","description":"PaddleOCR-VL-1.5是系列全新升级版，在OmniDocBench v1.5评测中精度达94.5%，超越全球顶尖模型。支持异形框定位，适应扫描、倾斜、拍摄等真实场景，保持SOTA性能。集成印章识别与文本检测，关键指标领先，兼顾部署效率与精度。"},"DeepSeek-OCR":{"provider":"silicon","real_model":"deepseek-ai\/DeepSeek-OCR","type":"chat","icon":"📄","description":"DeepSeek-OCR 是由深度求索（DeepSeek AI）推出的一个视觉语言模型，专注于光学字符识别（OCR）与“上下文光学压缩”。该模型旨在探索从图像中压缩上下文信息的边界，能够高效处理文档并将其转换为如 Markdown 等结构化文本格式"},"Hunyuan-MT-7B":{"provider":"silicon","real_model":"tencent\/Hunyuan-MT-7B","type":"chat","icon":"🌐","description":"混元翻译模型由Hunyuan-MT-7B（70亿参数轻量级）和集成模型Hunyuan-MT-Chimera组成。支持33种语言及5种少数民族语言互译，在WMT25竞赛31个语言类别中获30项第一。腾讯混元提出完整训练范式，同等规模下领先，计算高效且易于部署。"},"GLM-Z1-9B":{"provider":"silicon","real_model":"THUDM\/GLM-Z1-9B-0414","type":"chat","icon":"⚡","description":"GLM-Z1-9B-0414是GLM系列90亿参数的小型模型，延续开源传统，在数学推理和通用任务上表现出色，同规模开源模型中领先。采用与大模型相同的训练技术，在资源受限场景下实现效率与效果的平衡，适合轻量化部署。"},"GLM-4-9B":{"provider":"silicon","real_model":"THUDM\/GLM-4-9B-0414","type":"chat","icon":"⚡","description":"GLM-4-9B-0414是GLM系列90亿参数的小型模型，继承GLM-4-32B技术特点，轻量易部署。在代码生成、网页设计、SVG生成和搜索写作上表现出色。支持函数调用扩展能力，资源受限下平衡效率与效果，基准测试中具备竞争力。"},"DeepSeek-R1-Qwen8B":{"provider":"silicon","real_model":"deepseek-ai\/DeepSeek-R1-0528-Qwen3-8B","type":"chat","icon":"🔍","description":"DeepSeek-R1-0528-Qwen3-8B是将DeepSeek-R1思维链蒸馏至Qwen3 8B Base所得，开源模型中达SOTA。AIME 2024测试超越Qwen3 8B达10%，性能持平Qwen3-235B-thinking。数学推理、编程及逻辑表现优异，架构同Qwen3-8B，分词器沿用DeepSeek-R1。"},"Nex-N2-Pro":{"provider":"silicon","real_model":"nex-agi\/Nex-N2-Pro","type":"chat","icon":"🚀","description":"Nex-N2是具备能动性的思考模型，可自适应决定推理时机与深度，统一处理编码、搜索、工具等任务。在SWE-Pro等评测中居开源SOTA，编码、深度搜索及现实生产力任务表现顶尖。自适应思维减少30-50% token，性能不变。可与Claude Code、Cursor等框架即插即用。"},"Kolors":{"provider":"silicon","real_model":"Kwai-Kolors\/Kolors","type":"image","icon":"🎨","description":"Kolors 是由快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。该模型通过数十亿文本-图像对的训练，在视觉质量、复杂语义准确性以及中英文字符渲染方面展现出显著优势。它不仅支持中英文输入，在理解和生成中文特定内容方面也表现出色"},"Qwen3.6-35B-A3B":{"provider":"iflytek","real_model":"xopqwen36v35b","type":"chat","icon":"🧠","description":"Qwen3.6-35B-A3B，以稳定性与实用性为核心，在智能体编码、思维上下文保留上显著升级，为 350 亿参数、30 亿激活参数的因果视觉语言模型，编码开发体验更高效流畅。"},"Hy-MT2-7B":{"provider":"iflytek","real_model":"xophunyuan7bmt","type":"chat","icon":"🤖","description":"Hy-MT2 是一套主打 “快速推理” 的多语言翻译模型系列，专为复杂真实业务场景打造，覆盖从端侧轻量部署到服务器端高性能翻译的全场景需求。该系列在保持翻译质量领先的同时，实现了极致压缩与速度提升"},"Spark-X2-Flash":{"provider":"iflytek-coding-openai","real_model":"xsparkx2flash","type":"chat","icon":"🤖","description":"Spark-X2-Flash是科大讯飞基于华为昇腾910B集群训练的MoE架构模型。总参数300亿，支持256K上下文，在智能体与代码等能力上接近万亿级模型，成本仅为同性能模型的三分之一。"},"MiniMax-M3":{"provider":"nvidia","real_model":"minimaxai\/minimax-m3","type":"chat","icon":"🤖","description":"MiniMax M3是国内首个同时具备前沿编程能力、1M超长上下文及原生多模态的大模型。它采用自研MSA稀疏注意力架构，推理效率大幅提升，在SWE-Bench Pro等评测中超越GPT-5.5，接近Opus 4.7，支持图像、视频理解与桌面操作，是目前全球唯一的开源全能模型。"},"DeepSeek-V4-Flash":{"provider":"nvidia","real_model":"deepseek-ai\/deepseek-v4-flash","type":"chat","icon":"🤖","description":"DeepSeek-V4-Flash是深度求索开源的混合专家（MoE）模型，总参数量284B，激活参数仅13B。原生支持100万token超长上下文，采用CSA与HCA混合注意力架构，大幅提升长文本效率。支持三种可切换推理模式，在简单Agent任务上推理能力接近Pro版本，兼具高性能与高性价比，适合实时对话、函数调用等高频场景。"},"DeepSeek-V4-Pro":{"provider":"nvidia","real_model":"deepseek-ai\/deepseek-v4-pro","type":"chat","icon":"🤖","description":"DeepSeek-V4-Pro 是 2026 年 4 月发布的旗舰 MoE 大模型，总参 1.6 万亿、推理激活 490 亿参数，原生支持 100 万 Token 上下文。依托混合注意力架构大幅降低算力开销，数学、代码、长文档与 Agent 能力顶尖，性能对标国际顶级闭源模型，采用 MIT 协议开源可商用。"},"Llama-3.3-70B":{"provider":"nvidia","real_model":"meta\/llama-3.3-70b-instruct","type":"chat","icon":"🤖","description":"Llama 3.3 70B模型是一种功能强大的语言模型，可以应用于各种自然语言处理任务，包括语言理解、文本生成、问答、对话等。"},"Kimi-K2.6":{"provider":"nvidia","real_model":"moonshotai\/kimi-k2.6","type":"chat","icon":"🤖","description":"Kimi K2.6是月之暗面开源的旗舰多模态模型，MoE架构，总参数量1万亿，激活参数320亿，支持256K上下文。主打长周期编码与Agent集群，支持300个子Agent并行，在DeepSearchQA、SWE-Bench Pro等基准中行业领先。"},"Mixtral-8x7B":{"provider":"nvidia","real_model":"mistralai\/mixtral-8x7b-instruct-v0.1","type":"chat","icon":"🤖","description":"Mixtral-8x7B-Instruct-v0.1 是 Mistral AI 基于稀疏专家混合（SMoE）架构的开源大语言模型。模型总参数量 467亿，但推理时每个 token 仅激活 129亿参数，速度快且高效。它支持高达 32K 上下文，在数学、代码生成和多语言任务上超越 Llama 2 70B，指令版本在 MT-Bench 上达 8.30 分，比肩 GPT-3.5"},"GPT-OSS-20B":{"provider":"nvidia","real_model":"openai\/gpt-oss-20b","type":"chat","icon":"🤖","description":"openai\/gpt-oss-20b是OpenAI首批开源权重模型，采用MoE架构，总参数210亿，推理仅激活36亿，支持128K上下文。专为推理与Agent任务设计，具备可调节思考强度，优化后仅需16GB显存，性能与o3-mini相当。"},"GPT-OSS-120B":{"provider":"nvidia","real_model":"openai\/gpt-oss-120b","type":"chat","icon":"🤖","description":"openai\/gpt-oss-120b 是 OpenAI 于 2025 年 8 月推出的开源权重推理模型。总参数 1170 亿，采用 MoE 架构，每 token 激活 51 亿参数，支持 128K 上下文。专为高推理生产场景设计，性能接近 o4-mini，在多项基准测试中超越 o3-mini，可在单张 80GB GPU 上高效运行"},"gemma-26b":{"provider":"nvidia","real_model":"google\/diffusiongemma-26b-a4b-it","type":"chat","icon":"🤖","description":"google\/diffusiongemma-26b-a4b-it是谷歌基于Gemma 4 26B MoE的文本扩散模型，仅激活38亿参数，可并行生成256个token，H100上达1000+ tokens\/s，速度快4倍，支持256K上下文。"}}