尊龙凯时(中国)官方网站

尊龙凯时产品 尊龙凯时官方网站 关于尊龙凯时app平台官网 产品资讯 行业资讯 工程案例 联系我们

尊龙ag旗舰厅登录|曲山英里|拿20万块GPU马斯克上演「AI复仇记」

栏目:关于尊龙凯时app平台官网 发布时间: 来源:尊龙凯时app平台官网

  尊龙凯时appღღ★,尊龙凯时app平台官网尊龙ღღ★!尊龙凯时app平台官网ღღ★!尊龙凯时app首页ღღ★。北京时间2月18日中午ღღ★,马斯克和xAI发布了其最新旗舰模型Grok-3系列和最新聊天机器人Grokღღ★,凭借着马斯克的强大光环ღღ★,尽管xAI作为这场AI竞赛中的后发者ღღ★,但其一举一动都备受关注ღღ★。

  在不到一个小时ღღ★、百万人围观的发布会中ღღ★,xAI展现了Grok-3令人印象深刻的模型能力——从马斯克的最强数据集群到直接的评测数据对比ღღ★,似乎在回应他此前对Grok-3的评价——「地表最强AI」ღღ★。

  但据前OpenAI联合创始人Anderj Karpathy的评价ღღ★,「Grok-3+Thinking」感觉与OpenAl最强模型o1-pro相差无几ღღ★,但取得同等能力需要加上一个前提ღღ★:Grok-2和Grok-3之间ღღ★,才过去了六个月而已ღღ★。“达到最先进领域的时间表是前所未有的”ღღ★。Anderj Karpathy说ღღ★。

  Grok-3的发布符合马斯克的竞争观——他总是习惯用最快的时间表ღღ★、推动团队完成创新曲山英里ღღ★,这也是他擅长讲述的故事——用巨大的算力(20万张GPUღღ★,Grok-3使用了超出DeepSeek-V3百倍的算力)ღღ★、规模小的团队(xAI最初成立只有12人)ღღ★,做不下牌桌的人ღღ★。

  在大模型竞技场LMSYS上ღღ★,Grok-3早期版本(巧克力)在总榜上位列排名第一ღღ★,也是首个评分突破1400分的模型ღღ★,尤其在「编码」类别中ღღ★,Grok-3超越了o1和Gemini-thinking等顶级推理模型ღღ★。

  xAI现场演示了Grok-3的推理和创意编程能力ღღ★,例如让Grok-3生成一段从地球发射ღღ★、着陆火星再到返回地球的3D动画代码尊龙ag旗舰厅登录ღღ★,还有涉及推理能力的升级版俄罗斯方块小游戏ღღ★。

  这些模型核心能力升级也被马斯克融进了新的Grok应用中ღღ★,以Agent形式集成了DeepSearchღღ★、Think和Big Brain三种模式ღღ★,针对用户搜索场景ღღ★,提供编程ღღ★、数学等高阶能力ღღ★。DeepSearch可以联网和扫描X来分析信息ღღ★、提供查询和摘要ღღ★,Big Brain则可以进行更多ღღ★、更仔细的分布推理编程ღღ★。

  除此以外ღღ★,马斯克还透露后续语音交互ღღ★、多模态交互等新功能将上线ღღ★,xAI还将成立一个AI游戏社区尊龙ag旗舰厅登录ღღ★,马斯克此刻曾透露将开设AI游戏工作室ღღ★。

  Grok-3不会马上向所有用户开放ღღ★,针对X的Premium+订阅用户就首先获解锁ღღ★,在Grok独立的APP端也会推出会员服务「SuperGrok」——价格为每月30美元或每年300美元ღღ★。

  今天早些时候获得Grok-3的早期使用权的前OpenAI联合创始人Anderj Karpathy表示Grok-3是拥有最先进的思考模型之一ღღ★,性能与o1-pro相当ღღ★,“我们需要实际的ღღ★、真实的评估来观察ღღ★。”他举了一个例子ღღ★,他通过Grok-3 Think模式上传了GPT-2论文ღღ★,在问了一堆简单的查找问题ღღ★,要求其估计训练GPT-2所需的训练flops数量ღღ★,这考验模型将查找尊龙ag旗舰厅登录ღღ★、数学和知识相结合ღღ★,根据他的测试结果ღღ★,GPT-4o未能完成这项任务ღღ★,o1 pro也失败了ღღ★,但Grok-3 with Thinking 很好地解决了这个问题ღღ★。

  过去ღღ★,Grok还给人留下的印象是ღღ★,更幽默的ღღ★,有意思的AIღღ★,直播中xAI也强调了这一点ღღ★,但据Anderj Karpathy测试ღღ★,模型的幽默感似乎没有明显改善ღღ★,对「复杂的伦理问题」也过于敏感ღღ★。

  客观来看尊龙ag旗舰厅登录ღღ★,作为后发者ღღ★,xAI用不到一年时间推出Grok-3ღღ★,再度印证了马斯克「大力出奇迹」的优势ღღ★,但评估模型实际能力和落地依旧要看后续的产品功能情况ღღ★。

  在发布Grok-3前ღღ★,xAI在过去两年之间内对Grok系列的旗舰模型进行了三次大迭代ღღ★,在模型能力上ღღ★,Grok系列在推理ღღ★、阅读理解ღღ★、数学ღღ★、科学ღღ★、写代码等方面都呈现出不错的表现ღღ★。而在模型轻量化尊龙ag旗舰厅登录ღღ★、多模态方向上ღღ★,xAI也曾发布首个多模态模型Grok-1.5V和Grok-2miniღღ★,不断丰富其模型家族ღღ★。

  在产品交互形式和商业模式上ღღ★,马斯克也一直针对Grok进行优化ღღ★,在产品交互形式上ღღ★,一方面更新界面ღღ★、功能和产品组件ღღ★。如将X的实时洞察和网络搜索结合ღღ★,推出新的引文功能ღღ★,提升回答的准确性尊龙ag旗舰厅登录ღღ★。今年1月ღღ★,不同于内嵌于X内部ღღ★,xAI还宣布上线独立的iOS应用程序ღღ★,并围绕体育ღღ★、金融等场景推出新内容组件ღღ★,提升用户内容体验ღღ★。

  而在商业模式上ღღ★,通过免费和开放APIღღ★,降低模型使用门槛ღღ★,去年年底ღღ★,xAI宣布 Grok-2模型对X平台用户免费开放(当然也有使用限制)ღღ★,同步推出了企业API公开测试版ღღ★。「硅基研究室」查询发现ღღ★,目前xAI提供Grok-2-1212和Grok-2-vision-1212两种模型调用ღღ★,以Grok-2-1212为例ღღ★,其API定价为2.00美元/百万输入ღღ★、10美元/百万输出曲山英里ღღ★,同时xAI还推出了数据共享计划ღღ★,为参与团队提供每月获得150美元的免费API积分ღღ★。

  直播中ღღ★,xAI称Grok-3模型将与DeepSearch功能一起出现在xAI的企业API 中ღღ★,对于人们关注的开源问题上ღღ★,当Grok-3成熟稳定时ღღ★,可能在几个月内会开源Grok -2ღღ★。

  在大模型竞争曲山英里ღღ★、估值水涨船高的今天ღღ★,坚信Grok和马斯克能突围的人ღღ★,相信的是Grok自身的独特优势ღღ★,即数据ღღ★、卡ღღ★、钱和「反OpenAI故事」曲山英里尊龙ag旗舰厅登录ღღ★。

  首先ღღ★,是数据ღღ★。Grok与X高度绑定ღღ★,是一个闭环的内容生态ღღ★,高质量的数据和稳定的场景ღღ★,这本身就是先天优势ღღ★。马斯克多次强调ღღ★,Grok通过合成数据ღღ★,绕过了困扰其他AI模型的数据隐私和知识产权相关的法律挑战ღღ★,同时确保用户的数据隐私安全ღღ★。

  其次ღღ★,是卡ღღ★,即算力ღღ★。特斯拉和xAI储备了大量的英伟达H100系列芯片ღღ★,马斯克此前曾质疑机构给将「Meta列为囤积全球最多的H100 GPU」的排行榜ღღ★,指出「如果计算正确ღღ★,特斯拉应该是第二名ღღ★,xAI将是第三名」ღღ★,他还用122天将一个家电厂房改造为集合10万张H100芯片的超级算力集群ღღ★,就连英伟达创始人黄仁勋也忍不住感叹ღღ★:“在如此短的时间里内完成ღღ★,这简直是超人的成就”ღღ★。

  直播演示中ღღ★,马斯克在Grok-3发布前ღღ★,也率先展示他的最强数据集群ღღ★,团队表示ღღ★,他们在今年2月遇到很多问题ღღ★,如冷却和能耗等ღღ★,也浪费了很多算力ღღ★,但最终还是以Grok-2的10倍算力资源ღღ★,用六个月时间推出了Grok-3ღღ★。

  再者ღღ★,还有「人」ღღ★,xAI的团队核心成员曾在Google DeepMindღღ★、特斯拉ღღ★、OpenAI和微软等公司工作ღღ★。

  最后ღღ★,马斯克「反OpenAI」的故事也得到了不少人的拥趸ღღ★。一直以来ღღ★,马斯克的人工智能观就是反OpenAI而行ღღ★,他频繁以政治中立ღღ★、安全来强调xAI的不同ღღ★。

  首先ღღ★,就Grok自身而言曲山英里ღღ★,一方面ღღ★,就B端ღღ★,企业API调用上ღღ★,Grok目前还没有完备的服务企业的能力ღღ★,而我们看到在服务企业上ღღ★,用编码等能力吸引企业级客户ღღ★,OpenAI和Anthropic均有更快的进展ღღ★。据The information此前报道ღღ★,Anthropic从使用其模型进行软件开发和代码生成的客户那里获得的年化收入增长了10倍ღღ★。另一方面在C端尊龙ag旗舰厅登录ღღ★,目前Grok和X的集成度还不够多ღღ★,特别是尚未上线的语音ღღ★、视频等功能ღღ★。

  有业内人士产生的困惑是ღღ★,在OpenAI已集成了语音ღღ★、视频等功能下ღღ★,包括豆包在内的中国公司也做得不错ღღ★,Grok还能在这方面和X联合作出哪些新的创意?“如果只是一个TTS(文本转语音技术)ღღ★,那不会有改变”ღღ★。(虽然直播中ღღ★,xAI说不会是TTS)ღღ★。

  其次ღღ★,在外部ღღ★,在DeepSeek等中国模型公司的冲击下ღღ★,更激烈的竞争已经开启ღღ★,OpenAI已发布GPT-4.5和GPT-5路线图ღღ★,Anthropic也宣布将推出Claude 4 系列ღღ★。

  某种程度上ღღ★,在AI上的探索和尝试反映出的是马斯克从一而终的「竞争观」——用令人惊讶的时间表ღღ★,推着团队不顾一切的前进ღღ★,从而逼近自己的预期目标ღღ★,这在特斯拉ღღ★、SpaceX身上都有过验证ღღ★。

  在社交媒体上ღღ★,人们大多对马斯克的尝试表示兴奋ღღ★,这也发生在DeepSeek所掀起的浪潮中——一位人工智能创业者这样写ღღ★:“新的LLM比赛已经火爆起来了ღღ★,一周后谁会赢?”













Copyright @ 2009-2023 九江三和尊龙凯时app平台官网陶瓷科技有限公司 All Rights Reserved 备案号:赣ICP备11006424号