类别 | 大模型 | 总分 | 排名 |
---|---|---|---|
商用 | hunyuan-large | 87.3 | 1 |
商用 | hunyuan-turbo | 85.9 | 2 |
商用 | ERNIE-4.0 | 84.8 | 3 |
商用 | ERNIE-4.0-Turbo-8K | 84.1 | 4 |
商用 | GLM-4-Plus | 84.1 | 5 |
商用 | 360gpt2-pro | 83.7 | 6 |
商用 | 360gpt-pro | 83.4 | 7 |
商用 | Doubao-pro-32k | 83.1 | 8 |
商用 | xunfei-4.0Ultra | 82.9 | 9 |
开源 | qwen2.5-72b-instruct | 82.6 | 10 |
商用 | Claude-3.5-Sonnet | 82.2 | 11 |
商用 | abab7-chat-preview | 82.1 | 12 |
商用 | 360gpt-turbo | 82.0 | 13 |
商用 | qwen-max | 81.9 | 14 |
开源 | deepseek-chat-v3 | 81.8 | 15 |
商用 | gemini-2.0-flash-exp | 81.6 | 16 |
商用 | ERNIE-3.5-8K | 81.6 | 17 |
商用 | SenseChat-5 | 81.4 | 18 |
商用 | 360gpt2-o1 | 81.2 | 19 |
开源 | qwen2.5-32b-instruct | 81.1 | 20 |
商用 | xunfei-spark-max | 80.9 | 21 |
商用 | yi-lightning | 80.8 | 22 |
商用 | step-1-8k | 80.7 | 23 |
商用 | gemini-1.5-pro | 80.4 | 24 |
商用 | qwen-plus | 79.7 | 25 |
商用 | Baichuan4-Turbo | 79.7 | 26 |
开源 | qwen2.5-14b-instruct | 79.6 | 27 |
商用 | GLM4 | 79.5 | 28 |
商用 | gpt-4o | 79.5 | 29 |
商用 | mistral-large | 79.3 | 30 |
商用 | qwen-long | 78.6 | 31 |
开源 | internlm2_5-20b-chat | 77.7 | 32 |
开源 | Llama-3.3-70B-Instruct | 77.6 | 33 |
商用 | GLM-4-AirX | 77.5 | 34 |
开源 | phi-4 | 77.4 | 35 |
开源 | Hermes-3-Llama-3.1-405B | 77.3 | 36 |
商用 | gemini-1.5-flash | 77.3 | 37 |
商用 | abab6.5s-chat | 77.2 | 38 |
开源 | Llama-3.3-70B-Instruct-fp8 | 76.9 | 39 |
商用 | xunfei-spark-pro | 76.8 | 40 |
商用 | GLM-4-Long | 76.8 | 41 |
开源 | Llama-3.1-Nemotron-70B-Instruct-fp8 | 76.7 | 42 |
开源 | Meta-Llama-3.1-405B-Instruct | 76.5 | 43 |
商用 | GLM-4-Air | 76.4 | 44 |
商用 | Baichuan4-Air | 75.6 | 45 |
开源 | qwen2.5-7b-instruct | 75.4 | 46 |
商用 | qwen-turbo | 75.2 | 47 |
商用 | hunyuan-standard | 74.9 | 48 |
商用 | moonshot-v1-8k | 74.8 | 49 |
商用 | Baichuan4 | 74.5 | 50 |
商用 | SenseChat-Turbo | 74.4 | 51 |
商用 | step-1-flash | 74.2 | 52 |
开源 | Meta-Llama-3.1-70B-Instruct-fp8 | 74.0 | 53 |
开源 | Yi-1.5-34B-Chat | 73.9 | 54 |
商用 | GLM-4-Flash | 73.5 | 55 |
商用 | gpt-4o-mini | 73.5 | 56 |
开源 | internlm2_5-7b-chat | 73.2 | 57 |
开源 | glm-4-9b-chat | 73.2 | 58 |
开源 | gemma-2-27b-it | 73.1 | 59 |
商用 | gemini-1.5-flash-8b | 72.5 | 60 |
开源 | Llama-3.1-70B-Instruct | 72.4 | 61 |
开源 | WizardLM-2-8x22B | 71.2 | 62 |
商用 | mistral-small | 71.1 | 63 |
开源 | gemma-2-9b-it | 69.4 | 64 |
商用 | ERNIE-Speed-8K | 68.8 | 65 |
商用 | ministral-8b | 68.1 | 66 |
开源 | qwen2.5-3b-instruct | 68.0 | 67 |
商用 | SenseChat-v4 | 67.7 | 68 |
开源 | Yi-1.5-9B-Chat | 66.6 | 69 |
开源 | Mistral-Nemo-Instruct-2407 | 65.9 | 70 |
商用 | gemini-1.0-pro | 65.8 | 71 |
商用 | Doubao-lite-32k | 65.5 | 72 |
开源 | Llama-3.1-8B-Instruct | 63.9 | 73 |
开源 | Meta-Llama-3.1-8B-Instruct-fp8 | 63.7 | 74 |
开源 | Mixtral-8x7B-Instruct-v0.1 | 63.0 | 75 |
商用 | ministral-3b | 60.5 | 76 |
开源 | Llama-3.2-3B-Instruct | 60.2 | 77 |
开源 | qwen2.5-1.5b-instruct | 55.9 | 78 |
开源 | Mistral-7B-Instruct-v0.3 | 55.6 | 79 |
开源 | Llama-3.2-1B-Instruct | 45.9 | 80 |
开源 | qwen2.5-0.5b-instruct | 41.8 | 81 |
开源 | qwen2.5-math-72b-instruct | / | 82 |
开源 | qwq-32b-preview | / | 83 |
商用 | o1-mini | / | 84 |
商用 | o1-preview | / | 85 |