门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助中心
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
公社水吧
›
大话智能
›
Grok 3来了!马斯克称地球上最聪明AI,20万张GPU能否颠 ...
返回列表
Grok 3来了!马斯克称地球上最聪明AI,20万张GPU能否颠覆AI格局?
[复制链接]
弘法123
前天 21:16
显示全部楼层
|
阅读模式
Grok 3,马斯克口中的“最聪明AI”终于来了!
当地时间2月17号,埃隆•马斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,并称其是目前“地球上最聪明的AI”。
图 | Grok 3发布会(来源:xAI)
“我们非常高兴能够推出 Grok3,我们认为,在很短的时间内,它的功能比 Grok2 强大一个数量级。这要归功于一支不可思议的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。
有意思的是,他还解释了Grok这一名字的来历:Grok这个词来自罗伯特·海因莱因的小说《异乡异客》(Stranger in a Strange Land)。这是一个火星词,意思是充分而深刻地理解某事。
随后,xAI在发布会上简单粗暴地摆起了数字。
图 | Chatbot Arena成绩(来源:xAI)
Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。
图 | Grok 3的数学、科学和编程基准测试成绩(来源:xAI)
同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。
图 | Grok 3推理模型的数学、科学和编程基准测试成绩(来源:xAI)
xAI还现场演示了Grok 3的推理+编程能力,其中一个问题是“生成3D动画代码,演示从地球发射、着陆火星,然后在下一个发射窗口返回地球的过程”。
经过近两分钟的思考,Grok 3生成了可以直接跑起来的python代码,3D动画可以运行,但是否正确还有待验证。
图 | Grok 3生成的代码可以直接运行(来源:xAI)
Grok 3的最后一个新功能是代理/智能体(Agent)。发布会演示的是新产品DeepSearch,基于Grok 3的搜索引擎。
它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够返回正确的信息”。
在演示中,它还能基于搜索资料给出一些推测性的结论。
图 | DeepSearch功能演示(来源:xAI)
最后xAI表示,“我们今天将推出 Grok 3,首先从 X 上的 Premium+订阅者开始,他们将是第一批获得访问权限的人。”尚不清楚普通用户何时能用上。
马斯克补充称:“如果你想要一个更完善的版本,可能要等待一周,但每天都会有所改进。我们还在开发语音交互功能,我认为这将是 Grok 3 最好的体验之一。”
图 | 额外的DeepSearch功能演示(来源:xAI)
更强大的计算能力与训练方式
Grok 3的推出正值全球AI竞争日益激烈之际,尤其是在中国初创公司DeepSeek发布了一款能以低成本媲美OpenAI的GPT和o1/o3系列模型后,许多AI公司都开始重新评估用堆算力和参数来推进所谓的“扩展法则”是否仍然适用。
值得一提的是,马斯克曾称“Grok 3将在2024年底之前上线”,但却推迟到了今天。
至于原因,有人认为是xAI的技术团队规模较小,人才储备相对不足,难以完成马斯克“雄心勃勃的计划”。尽管如此,距离Grok 2系列模型发布才过去了六个月而已。
Grok 3由Colossus超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源——是Grok 2的10倍。
图 | Colossus设施(来源:xAI)
据介绍,xAI最开始搭建这个10万GPU集群用了122天,后续拓展到20万集群仅用了92天。
马斯克表示,这一显著的算力提升让Grok 3能够更高效地处理庞大数据集,缩短训练时间,并提升AI模型的准确性。
据介绍,在训练方法上,xAI采取了一些新的策略来优化Grok 3的能力,包括合成数据集、自我纠错机制和强化学习。
Grok 3相比前代在法律领域的理解能力也有所提升。马斯克曾表示,该模型的训练数据中包含了大量法律文件,使其在解读法律相关问题时更加精准。
尽管Grok 3被马斯克誉为“地球上最聪明的AI”,但它在早期测试中仍然暴露出一些局限性。
在正式发布之前,几名X平台用户表示自己可以提前体验Grok 3,他们发现,尽管该模型能够正确回答一些困难的谜题,并生成HTML和JavaScript代码,但是它在编写代码时仍然存在一些细节上的疏漏,出现了bug。
马斯克的AI野心与行业竞争
Grok 3的发布不仅仅是一款AI产品的更新,它也是马斯克与OpenAI等竞争对手较量的一部分。
2月13号,在迪拜召开的2025年世界政府峰会上,马斯克曾视频通话中表示:“Grok 3 具有非常强大的推理能力,因此在迄今为止我们进行的测试中,它的表现已经超越目前市场上的所有产品,这是一个好兆头。”
图 | xAI对比自己的发展速度(来源:xAI)
此外,马斯克继续对OpenAI表达不满。他批评OpenAI已经从最初的开源非营利组织变成了“封闭的、以利润为导向的公司”。
此前,马斯克试图以974亿美元的价格收购OpenAI,但遭到了该公司CEO山姆•奥特曼(Sam Altman)的拒绝。奥特曼认为,马斯克的提议不过是拖慢OpenAI发展的策略。
随着Grok 3的发布,xAI也在加速资本布局。
据报道,xAI正在与红杉资本(Sequoia Capital)、Andreessen Horowitz和Valor Equity Partners等现有投资者进行谈判,计划融资100亿美元,使公司估值达到750亿美元。
要知道,xAI的C轮60亿美元融资才刚刚在去年12月23号完成。如果新一轮融资成功,xAI的总融资金额将达到224亿美元。
这笔资金的一部分可能用于购买服务器,以支持Grok模型的进一步开发。据悉,xAI正在考虑从戴尔采购价值超过50亿美元的服务器,以提升其AI计算能力。
Grok 3的推出标志着xAI在AI竞赛中的又一次重大尝试。凭借强大的计算能力、优化的训练方法以及对逻辑推理的改进,马斯克寄希望于它能在AI市场上占据一席之地。
图 | Grok 3 在Arena排行榜中拿到了1402的高分(来源:lmarena.ai)
不过,这并不是一个容易实现的目标,即使背靠“流量之王”马斯克和X社交平台(所有X用户都可以免费使用Grok),Grok 3仍然面临着激烈的竞争。
在DeepSeek的冲击之下,OpenAI 已经接连放出o3-mini系列模型,以及GPT-4.5和GPT-5的路线图;Anthropic也宣布将在近期推出Claude 4系列。
随着OpenAI、Anthropic、Meta 和 Google等公司不断推出更先进的AI模型,未来的AI之战仍将持续升温。而Grok 3能否真正超越竞争对手,成为AI领域的佼佼者,还有待市场的进一步检验。
参考资料:
https://techcrunch.com/2025/01/27/grok-3-seemingly-went-live-for-some-users/
https://techcrunch.com/2025/02/14/elon-musks-ai-company-xai-said-to-be-in-talks-to-raise-10b/
https://www.servethehome.com/inside-100000-nvidia-gpu-xai-colossus-cluster-supermicro-helped-build-for-elon-musk/
https://lmarena.ai/
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
发表新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
弘法123
论坛元老
0
关注
0
粉丝
1135
帖子
Ta的主页
发布
发消息
加好友
最近发表
小米首款米家中央空调Pro等智能家居新品外观公布,2月底发布
记者探访|跑步、做饭……人形机器人“十八般武艺”这样炼成
智能穿戴概念涨3.25%,主力资金净流入这些股
伊朗革命卫队在该国西南部举行军演 多种新型无人机亮相
心理治疗机器人能否抚慰人类心灵
宇树科技新四足机器人外观曝光
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们