Từ xử lý ngôn ngữ, hình ảnh đến lập trình và nhiều lĩnh vực khác — trang này mang đến cho bạn cái nhìn tổng quan rõ ràng về từng nhóm nhiệm vụ. Nhờ đó, bạn dễ dàng chọn ra công cụ AI phù hợp nhất cho nhu cầu của mình. Muốn tìm hiểu sâu hơn? Bạn có thể xem chi tiết trong từng mục riêng.
Xem cách các công cụ AI được xếp hạng dựa trên độ linh hoạt, mức độ chính xác ngôn ngữ và hiệu quả xử lý trong các tác vụ văn bản.
So sánh khả năng thực hiện các tác vụ lập trình web của nhiều công cụ AI khác nhau trong không gian code
So sánh các mô hình AI dựa trên khả năng tạo ra hình ảnh phù hợp với mô tả bằng văn bản.
So sánh các mô hình AI dựa trên khả năng tạo và chỉnh sửa hình ảnh.
Xem bảng xếp hạng các mô hình AI dựa trên khả năng tìm kiếm web, cập nhật thông tin theo thời gian thực, khai thác nguồn kiến thức bên ngoài và trích dẫn dữ liệu một cách chính xác
So sánh các mô hình AI dựa trên khả năng tạo video từ hình ảnh được cung cấp
| Rank | Model | Score | Votes |
|---|---|---|---|
| 1 |
gemini-3-pro
|
1490 | 27.827 |
| 2 |
grok-4.1-thinking
|
1477 | 27.985 |
| 3 |
gemini-3-flash
|
1472 | 13.245 |
| 4 |
claude-opus-4-5-20251101-thinking-32k
|
1470 | 19.898 |
| 5 |
claude-opus-4-5-20251101
|
1467 | 21.241 |
| 6 |
grok-4.1
|
1465 | 32.015 |
| 7 |
gemini-3-flash (thinking-minimal)
|
1462 | 9.644 |
| 8 |
ernie-5.0-0110
|
1459 | 4.829 |
| 9 |
gpt-5.1-high
|
1458 | 24.439 |
| 10 |
gemini-2.5-pro
|
1451 | 87.641 |
| Rank | Model | Score | Votes |
|---|---|---|---|
| 1 |
claude-opus-4-5-20251101-thinking-32k
|
1510 | 6.717 |
| 2 |
claude-opus-4-5-20251101
|
1478 | 6.326 |
| 3 |
gpt-5.2-high
|
1477 | 1.691 |
| 4 |
gemini-3-pro
|
1467 | 13.138 |
| 5 |
gemini-3-flash
|
1450 | 6.563 |
| 6 |
glm-4.7
|
1447 | 4.833 |
| 7 |
minimax-m2.1-preview
|
1422 | 6.387 |
| 8 |
gemini-3-flash (thinking-minimal)
|
1416 | 4.649 |
| 9 |
gpt-5.2
|
1401 | 1.628 |
| 10 |
gpt-5-medium
|
1398 | 3.928 |
| Rank | Model | Score | Votes |
|---|---|---|---|
| 1 |
gpt-image-1.5
|
1238 | 45.800 |
| 2 |
gemini-3-pro-image-preview-2k (nano-banana-pro)
|
1231 | 36.047 |
| 3 |
gemini-3-pro-image-preview (nano-banana-pro)
|
1227 | 76.426 |
| 4 |
flux-2-max
|
1167 | 37.622 |
| 5 |
flux-2-flex
|
1154 | 60.108 |
| 6 |
gemini-2.5-flash-image-preview (nano-banana)
|
1154 | 717.212 |
| 7 |
flux-2-pro
|
1152 | 73.689 |
| 8 |
hunyuan-image-3.0
|
1150 | 148.009 |
| 9 |
flux-2-dev
|
1143 | 29.448 |
| 10 |
imagen-4.0-ultra-generate-preview-06-06
|
1143 | 481.963 |
| Rank | Model | Score | Votes |
|---|---|---|---|
| 1 |
chatgpt-image-latest (20251216)
|
1422 | 25.074 |
| 2 |
gemini-3-pro-image-preview-2k (nano-banana-pro)
|
1408 | 137.695 |
| 3 |
gemini-3-pro-image-preview (nano-banana-pro)
|
1405 | 411.013 |
| 4 |
gpt-image-1.5
|
1369 | 188.270 |
| 5 |
seedream-4.5
|
1331 | 129.530 |
| 6 |
gemini-2.5-flash-image-preview (nano-banana)
|
1325 | 10.267.110 |
| 7 |
seedream-4-2k
|
1292 | 218.707 |
| 8 |
flux-2-max
|
1279 | 42.643 |
| 9 |
flux-2-pro
|
1263 | 41.553 |
| 10 |
reve-v1.1
|
1261 | 124.641 |
| Rank | Model | Score | Votes |
|---|---|---|---|
| 1 |
gemini-3-pro-grounding
|
1213 | 11.511 |
| 2 |
gpt-5.2-search
|
1210 | 7.117 |
| 3 |
gpt-5.1-search
|
1199 | 8.877 |
| 4 |
grok-4-1-fast-search
|
1178 | 7.573 |
| 5 |
grok-4-fast-search
|
1164 | 26.302 |
| 6 |
gemini-2.5-pro-grounding
|
1143 | 31.350 |
| 7 |
o3-search
|
1138 | 21.174 |
| 8 |
ppl-sonar-reasoning-pro-high
|
1137 | 29.952 |
| 9 |
grok-4-search
|
1137 | 19.725 |
| 10 |
claude-opus-4-1-search
|
1128 | 30.825 |
| Rank | Model | Score | Votes |
|---|---|---|---|
| 1 |
veo-3.1-audio
|
1402 | 18.875 |
| 2 |
veo-3.1-fast-audio
|
1386 | 18.682 |
| 3 |
wan2.5-i2v-preview
|
1335 | 11.708 |
| 4 |
veo-3-audio
|
1328 | 33.963 |
| 5 |
veo-3-fast-audio
|
1322 | 43.132 |
| 6 |
seedance-v1.5-pro
|
1312 | 7.497 |
| 7 |
kling-2.6-pro
|
1284 | 9.386 |
| 8 |
seedance-v1-pro
|
1272 | 36.510 |
| 9 |
kling-2.5-turbo-1080p
|
1272 | 3.874 |
| 10 |
veo-3-fast
|
1256 | 27.266 |
|
|
Tổng quan | Chuyên gia | Câu lệnh khó | Lập trình | Toán học | Viết lách | Làm theo yêu cầu | Xử lý ngữ cảnh dài |
|---|---|---|---|---|---|---|---|---|
|
gemini-3-pro
|
1 | 4 | 1 | 4 | 2 | 1 | 3 | 3 |
|
grok-4.1-thinking
|
2 | 6 | 4 | 7 | 10 | 10 | 13 | 16 |
|
gemini-3-flash
|
3 | 9 | 5 | 10 | 4 | 3 | 8 | 8 |
|
claude-opus-4-5-20251101-thinking-32k
|
4 | 2 | 2 | 1 | 5 | 4 | 2 | 2 |
|
claude-opus-4-5-20251101
|
5 | 1 | 3 | 3 | 7 | 2 | 1 | 1 |
|
grok-4.1
|
6 | 21 | 10 | 14 | 17 | 15 | 15 | 14 |
|
gemini-3-flash (thinking-minimal)
|
7 | 11 | 12 | 11 | 8 | 9 | 11 | 9 |
|
|
8 | 12 | 11 | 12 | 1 | 16 | 16 | 24 |
|
gpt-5.1-high
|
9 | 7 | 9 | 15 | 6 | 13 | 9 | 11 |
|
gemini-2.5-pro
|
10 | 15 | 16 | 30 | 12 | 5 | 10 | 12 |
|
claude-sonnet-4-5-20250929-thinking-32k
|
11 | 3 | 6 | 2 | 9 | 7 | 4 | 5 |
|
|
12 | 24 | 15 | 25 | 37 | 17 | 23 | 32 |
|
claude-sonnet-4-5-20250929
|
13 | 8 | 8 | 6 | 25 | 6 | 6 | 6 |
|
claude-opus-4-1-20250805-thinking-16k
|
14 | 10 | 7 | 5 | 13 | 8 | 5 | 4 |
|
claude-opus-4-1-20250805
|
15 | 17 | 13 | 9 | 20 | 11 | 7 | 7 |
|
gpt-5.2
|
16 | 16 | 14 | 8 | 31 | 31 | 19 | 15 |
|
gpt-4.5-preview-2025-02-27
|
17 | 44 | 35 | 43 | 48 | 12 | 14 | 21 |
|
chatgpt-4o-latest-20250326
|
18 | 49 | 21 | 33 | 65 | 18 | 22 | 27 |
|
glm-4.7
|
19 | 23 | 17 | 17 | 15 | 25 | 18 | 13 |
|
gpt-5.2-high
|
20 | 5 | 18 | 16 | 3 | 34 | 17 | 22 |
|
gpt-5.1
|
21 | 18 | 22 | 20 | 41 | 23 | 20 | 19 |
|
gpt-5-high
|
22 | 19 | 25 | 29 | 16 | 57 | 37 | 53 |
|
|
23 | 13 | 19 | 19 | 14 | 37 | 21 | 20 |
|
o3-2025-04-16
|
24 | 28 | 34 | 44 | 11 | 47 | 50 | 61 |
|
grok-4-1-fast-reasoning
|
25 | 36 | 36 | 49 | 39 | 26 | 52 | 49 |
|
kimi-k2-thinking-turbo
|
26 | 20 | 23 | 18 | 18 | 40 | 26 | 35 |
|
gpt-5-chat
|
27 | 26 | 24 | 38 | 40 | 39 | 29 | 30 |
|
glm-4.6
|
28 | 40 | 33 | 40 | 26 | 28 | 32 | 36 |
|
|
29 | 52 | 27 | 22 | 21 | 36 | 31 | 33 |
|
claude-opus-4-20250514-thinking-16k
|
30 | 25 | 20 | 13 | 33 | 14 | 12 | 10 |
|
deepseek-v3.2-exp
|
31 | 45 | 28 | 34 | 27 | 24 | 30 | 26 |
|
deepseek-v3.2-exp-thinking
|
32 | 31 | 30 | 24 | 23 | 43 | 33 | 37 |
|
|
33 | 22 | 26 | 26 | 28 | 49 | 27 | 31 |
|
grok-4-fast-chat
|
34 | 46 | 43 | 46 | 24 | 53 | 47 | 44 |
|
deepseek-v3.2-thinking
|
35 | 34 | 32 | 35 | 46 | 42 | 36 | 29 |
|
deepseek-v3.2
|
36 | 39 | 29 | 28 | 22 | 29 | 24 | 23 |
|
deepseek-r1-0528
|
37 | 55 | 42 | 36 | 68 | 45 | 58 | 60 |
|
kimi-k2-0905-preview
|
38 | 53 | 39 | 32 | 42 | 56 | 65 | 66 |
|
|
39 | 32 | 53 | 68 | 51 | 21 | 53 | 47 |
|
kimi-k2-0711-preview
|
40 | 56 | 48 | 42 | 79 | 67 | 74 | 69 |
|
deepseek-v3.1-thinking
|
41 | 42 | 38 | 45 | 32 | 22 | 25 | 17 |
|
deepseek-v3.1
|
42 | 41 | 45 | 55 | 38 | 41 | 46 | 43 |
|
deepseek-v3.1-terminus
|
43 | - | 54 | 65 | 72 | 20 | 57 | 48 |
|
deepseek-v3.1-terminus-thinking
|
44 | - | 31 | 41 | 44 | 51 | 28 | 28 |
|
|
45 | 27 | 37 | 37 | 47 | 72 | 35 | 40 |
|
claude-opus-4-20250514
|
46 | 35 | 40 | 39 | 61 | 19 | 38 | 18 |
|
gpt-4.1-2025-04-14
|
47 | 64 | 50 | 48 | 90 | 27 | 51 | 42 |
|
mistral-medium-2508
|
48 | 59 | 46 | 52 | 63 | 52 | 49 | 55 |
|
mistral-large-3
|
49 | 58 | 47 | 31 | 34 | 66 | 44 | 52 |
|
grok-3-preview-02-24
|
50 | 63 | 51 | 60 | 89 | 30 | 41 | 38 |
|
grok-4-0709
|
51 | 38 | 57 | 69 | 19 | 33 | 54 | 50 |
|
glm-4.5
|
52 | 30 | 44 | 51 | 36 | 61 | 43 | 46 |
|
gemini-2.5-flash
|
53 | 48 | 67 | 83 | 52 | 32 | 45 | 45 |
|
gemini-2.5-flash-preview-09-2025
|
54 | 33 | 59 | 80 | 45 | 54 | 48 | 51 |
|
grok-4-fast-reasoning
|
55 | 54 | 69 | 64 | 43 | 55 | 61 | 57 |
|
claude-haiku-4-5-20251001
|
56 | 29 | 41 | 21 | 74 | 58 | 40 | 34 |
|
o1-2024-12-17
|
57 | 69 | 66 | 74 | 55 | 48 | 42 | 54 |
|
|
58 | 75 | 56 | 58 | 73 | 64 | 70 | 56 |
|
|
59 | 77 | 55 | 57 | 30 | 111 | 68 | 72 |
|
claude-sonnet-4-20250514-thinking-32k
|
60 | 37 | 49 | 27 | 60 | 35 | 34 | 25 |
|
longcat-flash-chat
|
61 | 51 | 52 | 23 | 29 | 97 | 62 | 78 |
|
|
62 | 14 | 65 | 62 | 59 | 63 | 63 | 65 |
|
deepseek-r1
|
63 | 72 | 60 | 59 | 53 | 60 | 55 | 67 |
|
amazon-nova-experimental-chat-12-10
|
64 | 61 | 58 | 66 | 49 | 84 | 64 | 76 |
|
|
65 | 66 | 64 | 61 | 67 | 69 | 59 | 58 |
|
|
66 | 47 | 61 | 47 | 54 | 86 | 66 | 64 |
|
deepseek-v3-0324
|
67 | 76 | 72 | 81 | 91 | 44 | 75 | 73 |
|
hunyuan-vision-1.5-thinking
|
68 | - | 68 | 67 | - | 68 | 60 | 68 |
|
mai-1-preview
|
69 | 65 | 76 | 77 | 71 | 76 | 77 | 71 |
|
o4-mini-2025-04-16
|
70 | 60 | 73 | 75 | 35 | 88 | 82 | 97 |
|
gpt-5-mini-high
|
71 | 62 | 75 | 78 | 50 | 101 | 76 | 92 |
|
claude-sonnet-4-20250514
|
72 | 71 | 63 | 54 | 80 | 46 | 56 | 41 |
|
claude-3-7-sonnet-20250219-thinking-32k
|
73 | 57 | 62 | 53 | 82 | 38 | 39 | 39 |
|
o1-preview
|
74 | 86 | 83 | 87 | 83 | 71 | 72 | 82 |
|
hunyuan-t1-20250711
|
75 | 67 | 79 | 100 | 58 | 50 | 73 | 74 |
|
|
76 | 87 | 70 | 50 | 88 | 73 | 67 | 63 |
|
mistral-medium-2505
|
77 | 85 | 80 | 76 | 107 | 74 | 85 | 75 |
|
|
78 | 79 | 71 | 63 | 85 | 102 | 83 | 81 |
|
hunyuan-turbos-20250416
|
79 | 106 | 85 | 104 | 109 | 70 | 94 | 88 |
|
gpt-4.1-mini-2025-04-14
|
80 | 83 | 78 | 72 | 106 | 83 | 79 | 77 |
|
minimax-m2.1-preview
|
81 | 43 | 74 | 56 | 57 | 89 | 71 | 62 |
|
gemini-2.5-flash-lite-preview-09-2025-no-thinking
|
82 | 81 | 86 | 103 | 93 | 77 | 88 | 79 |
|
glm-4.6v
|
83 | - | 91 | 88 | - | 79 | 78 | 83 |
|
gemini-2.5-flash-lite-preview-06-17-thinking
|
84 | 91 | 93 | 117 | 94 | 62 | 80 | 84 |
|
|
85 | 82 | 84 | 73 | 70 | 100 | 92 | 86 |
|
|
86 | 93 | 90 | 98 | 96 | 78 | 91 | 80 |
|
claude-3-5-sonnet-20241022
|
87 | 92 | 81 | 71 | 110 | 65 | 81 | 70 |
|
claude-3-7-sonnet-20250219
|
88 | 80 | 82 | 79 | 102 | 59 | 69 | 59 |
|
glm-4.5-air
|
89 | 78 | 88 | 82 | 77 | 98 | 87 | 85 |
|
|
90 | 84 | 89 | 84 | 69 | 105 | 89 | 94 |
|
minimax-m1
|
91 | 89 | 92 | 86 | 66 | 107 | 97 | 93 |
|
gemma-3-27b-it
|
92 | 116 | 108 | 144 | 119 | 81 | 102 | 100 |
|
o3-mini-high
|
93 | 74 | 77 | 70 | 56 | 113 | 84 | 91 |
|
amazon-nova-experimental-chat-11-10
|
94 | 50 | 87 | 85 | 62 | 136 | 90 | 95 |
|
grok-3-mini-high
|
95 | 68 | 95 | 110 | 78 | 96 | 86 | 87 |
|
gemini-2.0-flash-001
|
96 | 104 | 110 | 138 | 105 | 82 | 99 | 99 |
|
deepseek-v3
|
97 | 108 | 121 | 114 | 128 | 80 | 100 | 90 |
|
grok-3-mini-beta
|
98 | 88 | 102 | 115 | 92 | 93 | 93 | 98 |
|
mistral-small-2506
|
99 | 115 | 99 | 91 | 112 | 106 | 108 | 103 |
|
|
100 | 105 | 98 | 92 | 84 | 116 | 110 | 108 |
|
gpt-oss-120b
|
101 | 100 | 109 | 107 | 81 | 151 | 116 | 142 |
|
gemini-2.0-flash-lite-preview-02-05
|
102 | 118 | 123 | 161 | 117 | 85 | 114 | 111 |
|
glm-4.5v
|
103 | 70 | 97 | 96 | 100 | 112 | 104 | 119 |
|
command-a-03-2025
|
104 | 113 | 106 | 108 | 130 | 92 | 105 | 96 |
|
gemini-1.5-pro-002
|
105 | 114 | 120 | 148 | 116 | 75 | 106 | 104 |
|
hunyuan-turbos-20250226
|
106 | - | 104 | 99 | 138 | 124 | 95 | 106 |
|
o3-mini
|
107 | 94 | 101 | 89 | 86 | 127 | 103 | 102 |
|
amazon-nova-experimental-chat-10-09
|
108 | - | 116 | 109 | - | 138 | 123 | 129 |
|
llama-3.1-nemotron-ultra-253b-v1
|
109 | - | 96 | 105 | 87 | 95 | 96 | 121 |
|
amazon-nova-experimental-chat-10-20
|
110 | 95 | 100 | 93 | 76 | 153 | 98 | 107 |
|
|
111 | 73 | 105 | 95 | 64 | 119 | 113 | 105 |
|
|
112 | 99 | 107 | 90 | 99 | 164 | 125 | 140 |
|
step-3
|
113 | 101 | 94 | 94 | 95 | 120 | 101 | 113 |
|
minimax-m2
|
114 | 111 | 103 | 119 | 101 | 149 | 107 | 115 |
|
gpt-4o-2024-05-13
|
115 | 133 | 132 | 132 | 135 | 90 | 120 | 137 |
|
|
116 | 90 | 119 | 121 | 118 | 110 | 111 | 101 |
|
glm-4-plus-0111
|
117 | 135 | 147 | 171 | 140 | 108 | 130 | 124 |
|
claude-3-5-sonnet-20240620
|
118 | 112 | 113 | 101 | 113 | 123 | 109 | 109 |
|
gemma-3-12b-it
|
119 | 168 | 138 | 176 | 123 | 94 | 122 | 114 |
|
nvidia-llama-3.3-nemotron-super-49b-v1.5
|
120 | 103 | 111 | 97 | 75 | 117 | 121 | 112 |
|
hunyuan-turbo-0110
|
121 | - | 124 | 127 | 162 | 125 | 133 | 122 |
|
gpt-5-nano-high
|
122 | 102 | 118 | 120 | 111 | 181 | 117 | 138 |
|
o1-mini
|
123 | 107 | 114 | 112 | 98 | 152 | 112 | 117 |
|
nova-2-lite
|
124 | 97 | 115 | 102 | 114 | 162 | 115 | 125 |
|
llama-3.1-405b-instruct-bf16
|
125 | 136 | 127 | 123 | 124 | 128 | 139 | 143 |
|
|
126 | 96 | 117 | 116 | 97 | 133 | 119 | 126 |
|
gpt-4o-2024-08-06
|
127 | 134 | 145 | 143 | 131 | 99 | 126 | 127 |
|
gemini-advanced-0514
|
128 | 151 | 149 | 167 | 137 | 87 | 132 | 150 |
|
grok-2-2024-08-13
|
129 | 129 | 148 | 145 | 146 | 109 | 140 | 133 |
|
llama-3.1-405b-instruct-fp8
|
130 | 123 | 133 | 135 | 122 | 121 | 137 | 155 |
|
step-2-16k-exp-202412
|
131 | 119 | 130 | 128 | 125 | 91 | 127 | 120 |
|
yi-lightning
|
132 | 117 | 128 | 131 | 132 | 132 | 143 | 148 |
|
llama-4-maverick-17b-128e-instruct
|
133 | 120 | 129 | 126 | 120 | 115 | 134 | 131 |
|
|
134 | 109 | 125 | 111 | 104 | 143 | 135 | 123 |
|
llama-3.3-nemotron-49b-super-v1
|
135 | - | 112 | 140 | - | 131 | 118 | 130 |
|
hunyuan-large-2025-02-10
|
136 | 121 | 139 | 136 | 145 | 122 | 129 | 89 |
|
gpt-4-turbo-2024-04-09
|
137 | 148 | 160 | 158 | 143 | 104 | 146 | 158 |
|
claude-3-5-haiku-20241022
|
138 | 131 | 126 | 118 | 157 | 126 | 136 | 118 |
|
gemini-1.5-pro-001
|
139 | 127 | 144 | 157 | 144 | 103 | 142 | 110 |
|
deepseek-v2.5-1210
|
140 | 139 | 143 | 124 | 147 | 114 | 131 | 128 |
|
llama-4-scout-17b-16e-instruct
|
141 | 138 | 140 | 141 | 126 | 140 | 150 | 139 |
|
claude-3-opus-20240229
|
142 | 128 | 142 | 151 | 129 | 142 | 141 | 141 |
|
gpt-4.1-nano-2025-04-14
|
143 | 130 | 136 | 125 | 166 | 118 | 148 | 144 |
|
step-1o-turbo-202506
|
144 | 149 | 137 | 150 | 133 | 137 | 138 | 116 |
|
olmo-3.1-32b-instruct
|
145 | 158 | 131 | 122 | 161 | 135 | 124 | 134 |
|
|
146 | 98 | 122 | 106 | 108 | 176 | 128 | 136 |
|
llama-3.3-70b-instruct
|
147 | 147 | 152 | 159 | 142 | 145 | 159 | 161 |
|
glm-4-plus
|
148 | 141 | 157 | 154 | 154 | 141 | 149 | 146 |
|
gemma-3n-e4b-it
|
149 | 163 | 161 | 183 | 175 | 129 | 165 | 160 |
|
|
150 | 144 | 158 | 153 | 149 | 148 | 147 | 145 |
|
gpt-oss-20b
|
151 | 125 | 153 | 133 | 115 | 193 | 171 | 169 |
|
gpt-4o-mini-2024-07-18
|
152 | 159 | 165 | 156 | 165 | 134 | 158 | 147 |
|
nvidia-nemotron-3-nano-30b-a3b-bf16
|
153 | 110 | 141 | 142 | 103 | 184 | 153 | 179 |
|
|
154 | 122 | 146 | 147 | 134 | 160 | 154 | 163 |
|
mistral-large-2407
|
155 | 143 | 156 | 152 | 152 | 144 | 151 | 168 |
|
athene-v2-chat
|
156 | 132 | 134 | 129 | 127 | 179 | 145 | 152 |
|
gpt-4-1106-preview
|
157 | 157 | 163 | 166 | 136 | 146 | 156 | 172 |
|
gpt-4-0125-preview
|
158 | 162 | 168 | 172 | 139 | 154 | 164 | 164 |
|
hunyuan-standard-2025-02-10
|
159 | 154 | 166 | 170 | 150 | 157 | 167 | 135 |
|
gemini-1.5-flash-002
|
160 | 161 | 174 | 178 | 151 | 130 | 162 | 151 |
|
mercury
|
161 | - | 151 | 130 | - | 196 | 174 | 165 |
|
grok-2-mini-2024-08-13
|
162 | 153 | 172 | 168 | 169 | 163 | 166 | 157 |
|
deepseek-v2.5
|
163 | 146 | 154 | 134 | 155 | 167 | 161 | 159 |
|
athene-70b-0725
|
164 | 145 | 164 | 155 | 179 | 165 | 172 | 175 |
|
magistral-medium-2506
|
165 | 155 | 135 | 113 | 153 | 155 | 144 | 132 |
|
mistral-large-2411
|
166 | 170 | 162 | 160 | 158 | 158 | 157 | 167 |
|
olmo-3-32b-think
|
167 | 126 | 150 | 137 | 121 | 173 | 152 | 154 |
|
mistral-small-3.1-24b-instruct-2503
|
168 | 137 | 155 | 139 | 164 | 161 | 155 | 149 |
|
gemma-3-4b-it
|
169 | 180 | 182 | 207 | 182 | 159 | 179 | 162 |
|
|
170 | 150 | 159 | 149 | 141 | 177 | 160 | 156 |
|
llama-3.1-nemotron-70b-instruct
|
171 | 152 | 167 | 174 | 163 | 156 | 169 | 184 |
|
hunyuan-large-vision
|
172 | 142 | 171 | 146 | 156 | 147 | 163 | 153 |
|
llama-3.1-70b-instruct
|
173 | 167 | 177 | 169 | 174 | 175 | 176 | 174 |
|
amazon-nova-pro-v1.0
|
174 | 166 | 175 | 162 | 173 | 191 | 173 | 171 |
|
jamba-1.5-large
|
175 | 160 | 183 | 182 | 189 | 172 | 181 | 201 |
|
gemma-2-27b-it
|
176 | 181 | 185 | 190 | 191 | 139 | 178 | 173 |
|
ibm-granite-h-small
|
177 | 140 | 176 | 173 | 160 | 185 | 180 | 176 |
|
reka-core-20240904
|
178 | 156 | 188 | 179 | 187 | 166 | 185 | 187 |
|
gpt-4-0314
|
179 | 176 | 170 | 175 | 159 | 180 | 170 | 189 |
|
llama-3.1-nemotron-51b-instruct
|
180 | 183 | 186 | 184 | 171 | 171 | 186 | 193 |
|
llama-3.1-tulu-3-70b
|
181 | - | 192 | 187 | 177 | 182 | 177 | 191 |
|
gemini-1.5-flash-001
|
182 | 172 | 179 | 185 | 181 | 170 | 184 | 170 |
|
olmo-3.1-32b-think
|
183 | 124 | 169 | 165 | 148 | 186 | 168 | 166 |
|
claude-3-sonnet-20240229
|
184 | 169 | 184 | 177 | 183 | 183 | 182 | 183 |
|
gemma-2-9b-it-simpo
|
185 | 195 | 194 | 212 | 213 | 150 | 192 | 178 |
|
nemotron-4-340b-instruct
|
186 | 179 | 187 | 188 | 184 | 190 | 187 | 180 |
|
command-r-plus-08-2024
|
187 | 186 | 202 | 203 | 195 | 169 | 191 | 185 |
|
llama-3-70b-instruct
|
188 | 188 | 189 | 192 | 180 | 178 | 188 | 205 |
|
gpt-4-0613
|
189 | 185 | 178 | 180 | 168 | 168 | 175 | 188 |
|
mistral-small-24b-instruct-2501
|
190 | 177 | 181 | 181 | 178 | 195 | 189 | 186 |
|
glm-4-0520
|
191 | 182 | 190 | 186 | 186 | 188 | 190 | 194 |
|
reka-flash-20240904
|
192 | 165 | 198 | 198 | 192 | 187 | 195 | 199 |
|
|
193 | 164 | 173 | 164 | 170 | 206 | 183 | 181 |
|
c4ai-aya-expanse-32b
|
194 | 174 | 196 | 197 | 193 | 194 | 194 | 177 |
|
gemma-2-9b-it
|
195 | 192 | 204 | 213 | 204 | 174 | 200 | 198 |
|
deepseek-coder-v2
|
196 | 173 | 180 | 163 | 172 | 207 | 193 | 182 |
|
command-r-plus
|
197 | 189 | 206 | 214 | 207 | 192 | 202 | 202 |
|
|
198 | 178 | 193 | 195 | 167 | 198 | 201 | 203 |
|
claude-3-haiku-20240307
|
199 | 184 | 199 | 194 | 194 | 201 | 199 | 197 |
|
amazon-nova-lite-v1.0
|
200 | 175 | 195 | 191 | 188 | 199 | 197 | 190 |