Grok 如今我们越来越明显地感受到,“Scaling Law 规模扩展”似乎走到了尽头。即使投入了庞大的算力资源,Grok-3 的性能也只略高于 GPT-4o,这让人不禁怀疑,单纯依赖堆叠算力的路径,是否仍是一条可持续的发展方向。我们先来看具体的跑分表现。从整体成绩来看,Grok-3 是首个综合得分突破 1400 分的大模型,正式登顶当前评测榜单,也兑现了马斯克曾经的“豪言壮语”。模型跑分细节表现