排名 | 模型 | 机构 | 总分 | OPEN 多轮开放问题 | OPT 三大能力客观题 | 使用 |
---|---|---|---|---|---|---|
1 | GPT4 | OpenAI | 87.08 | 88.07 | 85.6 | API |
2 | Claude2 | Anthropic | 72.46 | 75.11 | 68.48 | API |
3 | GPT3.5 | OpenAI | 71.12 | 73.12 | 68.13 | API |
4 | vivoLM | vivo | 70.74 | 66.78 | 76.67 | 申请 |
5 | Moonshot | 月之暗面 | 70.42 | 66.02 | 77.03 | 网页 |
6 | 文心一言4.0 | 百度 | 69.26 | 61.81 | 80.44 | API |
7 | SenseChat 3.0 | 商汤科技 | 69.25 | 63.16 | 78.39 | API |
8 | 讯飞星火V3.0 | 科大讯飞 | 63.99 | 59.26 | 71.08 | API |
9 | 云雀大模型(豆包) | 字节跳动 | 64.39 | 59.11 | 72.3 | 网页 |
10 | ChatGLM2-Pro | 清华&智谱 | 65.93 | 58.53 | 77.02 | API |
11 | Baichuan2-13B-Chat | 百川智能 | 62.7 | 57.77 | 70.09 | 模型 |
12 | MiniMax-Abab5.5 | MiniMax | 59.57 | 48.13 | 76.72 | API |
13 | 讯飞星火V2.0 | 科大讯飞 | 55.24 | 47.95 | 66.18 | API |
14 | OpenBuddy-70B | OpenBuddy | 53.34 | 45.14 | 65.65 | 模型 |
15 | 通义千问plus | 阿里巴巴 | 57.09 | 43.36 | 77.68 | API |
16 | Qwen-14B-Chat | 阿里巴巴 | 56.97 | 43.1 | 77.78 | API |
17 | Chinese_Alpaca_2_13B | yiming cui | 47.27 | 41.95 | 55.26 | 模型 |
18 | Llama2-13B-Chat | Meta | 36.46 | 33.91 | 40.28 | 模型 |
19 | ChatGLM2-6B | 清华&智谱 | 42.27 | 29.48 | 61.45 | 模型 |
20 | 360GPT_S2_V9 | 360 | 43.79 | 28.44 | 66.82 | API |