在科技界万众瞩目的时刻,埃隆·马斯克通过其旗下的X平台,以一场别开生面的直播发布会,向世界介绍了人工智能领域的最新力作——Grok 4。这款被马斯克誉为超越博士生智能水平的新模型,不仅引发了业界的轰动,也在网络上掀起了热烈讨论。
发布会现场,马斯克身着一件标志性的皮夹克,在xAI团队成员的簇拥下,亲自上阵演示了Grok 4的强大功能。他自豪地宣布,Grok 4系列包含两个版本:标准版Grok 4和性能更为强劲的Grok 4 Heavy。这两款模型均专注于推理能力,摒弃了非推理模式,展现出了前所未有的智能水平。
据马斯克介绍,Grok 4在SAT和GRE考试中均取得了近乎满分的优异成绩,其表现甚至超过了绝大多数研究生。在“人类终极考试”这一极具挑战性的基准测试中,Grok 4也交出了50.7%的高分答卷,这一成绩是在使用测试时计算、工具和多个并行智能体的情况下取得的。更令人惊叹的是,Grok 4还能从网络,特别是X平台上抓取实时数据,这意味着在对话中它能直接提供最新信息,无需用户额外打开浏览器。
Grok 4的另一大亮点是对互联网文化的深刻理解。经过精心调校,它能高精度解读网络迷因、俚语和幽默内容,有望成为最“懂网络”的AI助手之一。尽管马斯克承认,目前Grok 4有时可能缺乏常识,也尚未能发明新技术或发现新的物理学知识,但他坚信这只是时间问题。
在基准测试方面,Grok 4同样展现出了强大的实力。xAI声称,在无需“工具”辅助的情况下,Grok 4在“人类的最后考试”中获得了25.4%的准确率,这一成绩超过了谷歌的Gemini 2.5 Pro和OpenAI的o3。而配备“工具”的Grok 4 Heavy更是取得了44.4%的得分,远超配备工具的Gemini 2.5 Pro。在ARC-AGI等基准测试中,Grok 4也取得了令人瞩目的成绩,创下了新的最优记录。
在发布会前夕,xAI的首席科学家Igor Babuschkin突然辞职,这无疑给发布会增添了一丝神秘色彩。然而,这并未影响Grok 4的发布进程。马斯克在发布会上表示,Grok 4预计将支持文本、图像,甚至可能支持视频处理,这将使其在多模态能力上更上一个台阶,与OpenAI的GPT-5o和谷歌的Gemini 2.5 Pro形成有力竞争。
用户可以通过多种平台访问Grok 4,包括xAI控制台、Grok.com、X平台以及Grok的iOS和Android应用。其中,xAI控制台主要面向开发者和企业用户,而Grok.com和X平台则提供免费访问服务,但设有使用额度限制。
对于Grok 4的卓越表现,网友们纷纷表示惊叹。在Hacker News、Reddit等平台上,网友们热烈讨论着Grok 4的各项基准测试成绩,认为这款模型确实达到了新的SOTA水平。有网友甚至预测,OpenAI的新模型可能会在Grok 4发布后紧随其后,争个后来者居上。
随着Grok 4的发布,人工智能领域又迎来了一次重大突破。马斯克和他的xAI团队再次证明了他们在科技创新方面的雄厚实力。未来,Grok 4将在多模态能力、视频处理等方面继续发力,为人工智能的发展开辟新的道路。