Grok 3模型震撼发布抢先免费体验

北京时间 2 月 18 日中午 12 点，马斯克旗下 xAI 公司正式发布了备受瞩目的新一代人工智能模型——Grok 3。号称地表最强模型，这款被马斯克吹上天的产品具体如何，我们通过直播视频的几张关键对比图来一探究竟。同时推荐一个快速尝鲜 Grok 3 的网站。

Grok 3 的亮点

上图展示的是 Chatbot Arena (LMSYS) 平台上不同大型语言模型 (LLM) 的 Elo 评分，反映了它们在用户体验和性能方面的相对排名。图表中，Grok-3 的早期版本 “chocolate” 以 1400+ 的高分位居榜首，gemini 2.- flash 1380 分，deepseek r1 有 1360 分。

上图展示了不同大型语言模型（LLM）在数学、科学和编程三个基准测试中的得分情况。其中，Grok-3 在所有三个测试中都取得了最高分，超过了 deepseek v 3、gemini、Claude、GPT 4 O。

上图展示了不同大型语言模型在 AIME 2025 数学竞赛中的表现，主要考察它们的推理能力和计算能力。其中，Grok-3 Reasoning Beta 版本为 93 分，Grok-3 mini Reasoning 版本也达到了 90 分，显示出 Grok 系列模型在数学推理方面的强大实力。相比之下，Deepseek-R 1 和 Gemini-2 Flash Thinking 的得分分别为 87 分和 79 分，o3 mini (high) 和 o1 模型的得分则分别为 87 分和 75 分。整体来看，Grok-3 系列模型在 AIME 2025 测试中表现突出，尤其 Grok-3 Reasoning Beta 版本在数学推理能力上展现出显著优势。

抢先体验 Grok 3

本文推荐一个免费体验 Grok 3 早期版本的网址。

1	`https://lmarena.ai/`

进入网站后点击直接对话，选择 Grok 3 即可。

目前 grok 3 已经免费使用啦。体验了下还是很不错的，速度很快。（修改于 2025 年 2 月 24 日）

结论

马斯克凭借 200,000 个 Nvidia H 100 GPU 和超长的训练周期，打造出这款在纸面数据上超越众多现有模型的产品。然而，与 Deepseek 等竞争对手相比，Grok 3 巨大的成本投入并未带来显著的优势提升。试问，除了少数几家顶级科技巨头，还有哪家企业能够负担如此庞大的显卡资源和高昂的训练成本？这种“堆料”式的开发路径，似乎并不具备明显的长期竞争优势。目前，Grok 3 尚未正式发布，其实际应用效果及市场影响力仍有待进一步观察。

BY

纯个人经验，如有帮助，请收藏点赞。
微信公众号：环境猫 er
CSDN : 细节处有神明
个人博客： https://maoyu92.github.io/

工具推荐

#AIGC #deepseek #grok3

Grok 3模型震撼发布抢先免费体验

https://maoyu92.github.io/2025/02/18/03 工具推荐/Grok 3模型震撼发布抢先免费体验/

作者

陈文茂

发布于

2025年2月18日

许可协议

ProcessOn与DeepSeek强强联合，制图效率upup！上一篇

Deepseek + Napkin，轻松打造高颜值流程图下一篇

Grok 3模型震撼发布 抢先免费体验

Grok 3 的亮点

抢先体验 Grok 3

结论

BY

Grok 3模型震撼发布抢先免费体验