Grok 3模型震撼发布 抢先免费体验

北京时间 2 月 18 日中午 12 点,马斯克旗下 xAI 公司正式发布了备受瞩目的新一代人工智能模型——Grok 3。号称地表最强模型,这款被马斯克吹上天的产品具体如何,我们通过直播视频的几张关键对比图来一探究竟。同时推荐一个快速尝鲜 Grok 3 的网站。

Grok 3 的亮点

上图展示的是 Chatbot Arena (LMSYS) 平台上不同大型语言模型 (LLM) 的 Elo 评分,反映了它们在用户体验和性能方面的相对排名。图表中,Grok-3 的早期版本 “chocolate” 以 1400+ 的高分位居榜首,gemini 2.- flash 1380 分,deepseek r1 有 1360 分。

上图展示了不同大型语言模型(LLM)在数学、科学和编程三个基准测试中的得分情况。其中,Grok-3 在所有三个测试中都取得了最高分,超过了 deepseek v 3、gemini、Claude、GPT 4 O。

上图展示了不同大型语言模型在 AIME 2025 数学竞赛中的表现,主要考察它们的推理能力和计算能力。其中,Grok-3 Reasoning Beta 版本为 93 分,Grok-3 mini Reasoning 版本也达到了 90 分,显示出 Grok 系列模型在数学推理方面的强大实力。相比之下,Deepseek-R 1 和 Gemini-2 Flash Thinking 的得分分别为 87 分和 79 分,o3 mini (high) 和 o1 模型的得分则分别为 87 分和 75 分。整体来看,Grok-3 系列模型在 AIME 2025 测试中表现突出,尤其 Grok-3 Reasoning Beta 版本在数学推理能力上展现出显著优势。

抢先体验 Grok 3

本文推荐一个免费体验 Grok 3 早期版本的网址。

1
https://lmarena.ai/

进入网站后点击直接对话,选择 Grok 3 即可。
image.png

目前 grok 3 已经免费使用啦。体验了下还是很不错的,速度很快。(修改于 2025 年 2 月 24 日)

结论

马斯克凭借 200,000 个 Nvidia H 100 GPU 和超长的训练周期,打造出这款在纸面数据上超越众多现有模型的产品。然而,与 Deepseek 等竞争对手相比,Grok 3 巨大的成本投入并未带来显著的优势提升。试问,除了少数几家顶级科技巨头,还有哪家企业能够负担如此庞大的显卡资源和高昂的训练成本?这种“堆料”式的开发路径,似乎并不具备明显的长期竞争优势。目前,Grok 3 尚未正式发布,其实际应用效果及市场影响力仍有待进一步观察。

BY

纯个人经验,如有帮助,请收藏点赞。
微信公众号:环境猫 er
CSDN : 细节处有神明
个人博客: https://maoyu92.github.io/


Grok 3模型震撼发布 抢先免费体验
https://maoyu92.github.io/2025/02/18/03 工具推荐/Grok 3模型震撼发布 抢先免费体验/
作者
陈文茂
发布于
2025年2月18日
许可协议