类别 | 大模型 | 阅读理解能力 | 排名 |
---|---|---|---|
商用 | xunfei-4.0Ultra | 94.0 | 1 |
商用 | ERNIE-4.0 | 93.8 | 2 |
商用 | ERNIE-4.0-Turbo-8K | 93.2 | 3 |
开源 | qwen2.5-72b-instruct | 91.7 | 4 |
商用 | qwen-max | 91.5 | 5 |
商用 | hunyuan-large | 90.8 | 6 |
商用 | GLM-4-Plus | 90.2 | 7 |
商用 | GLM4 | 90.0 | 8 |
商用 | gpt-4o | 90.0 | 9 |
商用 | hunyuan-turbo | 89.4 | 10 |
商用 | Baichuan4 | 89.2 | 11 |
商用 | Doubao-pro-32k | 88.7 | 12 |
商用 | 360gpt-pro | 87.9 | 13 |
商用 | 360gpt2-pro | 87.9 | 14 |
商用 | ERNIE-3.5-8K | 87.6 | 15 |
商用 | SenseChat-5 | 87.2 | 16 |
商用 | qwen-plus | 86.2 | 17 |
商用 | xunfei-spark-pro | 86.2 | 18 |
商用 | qwen-long | 86.2 | 19 |
开源 | qwen2.5-32b-instruct | 85.8 | 20 |
商用 | Baichuan4-Turbo | 85.7 | 21 |
商用 | GLM-4-AirX | 85.7 | 22 |
商用 | Baichuan4-Air | 85.5 | 23 |
商用 | hunyuan-standard | 85.3 | 24 |
商用 | qwen-turbo | 85.1 | 25 |
开源 | qwen2.5-14b-instruct | 85.0 | 26 |
商用 | 360gpt-turbo | 84.9 | 27 |
商用 | GLM-4-Air | 84.7 | 28 |
商用 | Claude-3.5-Sonnet | 84.6 | 29 |
商用 | gemini-1.5-pro | 84.2 | 30 |
商用 | SenseChat-Turbo | 83.9 | 31 |
商用 | abab7-chat-preview | 83.9 | 32 |
商用 | xunfei-spark-max | 82.6 | 33 |
开源 | Yi-1.5-34B-Chat | 81.8 | 34 |
商用 | step-1-8k | 81.1 | 35 |
商用 | GLM-4-Flash | 80.5 | 36 |
开源 | glm-4-9b-chat | 80.0 | 37 |
商用 | yi-lightning | 79.8 | 38 |
开源 | internlm2_5-20b-chat | 79.7 | 39 |
商用 | mistral-large | 79.3 | 40 |
商用 | gemini-1.5-flash | 78.4 | 41 |
开源 | qwen2.5-7b-instruct | 78.3 | 42 |
商用 | GLM-4-Long | 78.3 | 43 |
开源 | Hermes-3-Llama-3.1-405B | 78.1 | 44 |
开源 | internlm2_5-7b-chat | 78.0 | 45 |
商用 | moonshot-v1-8k | 78.0 | 46 |
商用 | step-1-flash | 77.5 | 47 |
商用 | 360gpt2-o1 | 77.4 | 48 |
商用 | ERNIE-Speed-8K | 77.2 | 49 |
开源 | Llama-3.3-70B-Instruct | 77.1 | 50 |
开源 | Llama-3.1-Nemotron-70B-Instruct-fp8 | 76.7 | 51 |
商用 | gemini-2.0-flash-exp | 76.7 | 52 |
商用 | abab6.5s-chat | 76.5 | 53 |
开源 | Meta-Llama-3.1-405B-Instruct | 76.5 | 54 |
开源 | Llama-3.3-70B-Instruct-fp8 | 76.3 | 55 |
开源 | qwq-32b-preview | 76.2 | 56 |
开源 | Llama-3.1-70B-Instruct | 75.7 | 57 |
开源 | Meta-Llama-3.1-70B-Instruct-fp8 | 75.6 | 58 |
商用 | SenseChat-v4 | 75.1 | 59 |
开源 | gemma-2-9b-it | 74.8 | 60 |
开源 | gemma-2-27b-it | 74.8 | 61 |
商用 | gemini-1.0-pro | 74.1 | 62 |
开源 | Yi-1.5-9B-Chat | 73.9 | 63 |
开源 | deepseek-chat-v3 | 73.4 | 64 |
商用 | Doubao-lite-32k | 71.9 | 65 |
开源 | phi-4 | 70.7 | 66 |
开源 | qwen2.5-3b-instruct | 70.6 | 67 |
商用 | gemini-1.5-flash-8b | 70.0 | 68 |
商用 | gpt-4o-mini | 68.9 | 69 |
商用 | o1-mini | 65.7 | 70 |
开源 | qwen2.5-1.5b-instruct | 65.6 | 71 |
开源 | Llama-3.1-8B-Instruct | 65.3 | 72 |
开源 | Meta-Llama-3.1-8B-Instruct-fp8 | 64.4 | 73 |
开源 | WizardLM-2-8x22B | 63.5 | 74 |
商用 | mistral-small | 62.5 | 75 |
开源 | Mixtral-8x7B-Instruct-v0.1 | 60.9 | 76 |
商用 | ministral-8b | 60.2 | 77 |
开源 | Llama-3.2-3B-Instruct | 58.1 | 78 |
开源 | Mistral-Nemo-Instruct-2407 | 58.0 | 79 |
开源 | Mistral-7B-Instruct-v0.3 | 57.6 | 80 |
商用 | ministral-3b | 54.5 | 81 |
开源 | Llama-3.2-1B-Instruct | 52.3 | 82 |
开源 | qwen2.5-0.5b-instruct | 50.4 | 83 |
开源 | qwen2.5-math-72b-instruct | / | 84 |
商用 | o1-preview | / | 85 |