当前位置：首页 » 资讯 » 新科技 » 正文

马斯克宣称Grok智能超越人类，图像训练短板待补：一个月内或迎关键突破

IP属地中国·北京 编辑：陆辰风大力财经 时间：2025-07-10 16:31:39

2025年7月10日，财联社电——在今日举行的xAI直播活动中，特斯拉与SpaceX创始人埃隆·马斯克公开表示，其旗下人工智能公司xAI开发的聊天机器人Grok已在“大多数领域展现出超越人类的智能水平”，但当前版本的Grok 4仍存在图像理解盲区，需通过改进后的图像训练模块优化，预计问题将在一个月内解决。
智能超越人类？马斯克抛出“AI里程碑”论断
马斯克在直播中直言：“Grok 4在逻辑推理、多模态交互和复杂任务处理上已显著优于普通人类，甚至在部分专业领域接近顶尖专家水平。”他举例称，Grok在科学文献分析、代码生成和实时决策等场景中表现突出，其训练效率较前代提升300%，响应速度缩短至0.8秒。
这一表述与马斯克长期倡导的“AI奇点论”一脉相承。他此前曾预测，到2025年底，AI将具备“超越人类所有领域”的通用智能（AGI），而Grok的进化路径正是这一愿景的实践载体。据xAI披露，Grok 4基于全球最大的开源数据集训练，参数量达10万亿级，支持中、英、法等20种语言，并接入Twitter（现X平台）实时数据流，具备“自我进化”能力。
图像训练成短板：盲区问题或一个月内攻克
尽管性能领先，马斯克坦言Grok 4仍存在“致命缺陷”——图像理解能力不足。他解释称，当前版本的Grok在处理抽象图像、复杂场景和动态视觉信息时，准确率较文本任务低40%以上，例如难以识别手绘草图中的隐喻含义，或区分照片中微小物体的功能属性。
“这就像一个天才数学家看不懂漫画书。”马斯克比喻道，“我们需要为Grok植入更强大的‘视觉大脑’。”据xAI技术团队透露，改进方案包括升级多模态大模型架构、引入3D空间感知算法，并扩充包含10亿张高分辨率图像的专用训练集。马斯克承诺，新版本将于“一个月内”完成部署，届时Grok将实现文本、图像、视频的跨模态无缝交互。
技术竞赛白热化：Grok能否后来居上？
当前，全球AI巨头正围绕多模态能力展开激烈角逐。OpenAI的GPT-4o已支持实时语音和图像生成，谷歌Gemini则通过“原生多模态”架构实现文本与图像的深度融合，而meta的Llama 3.1更强调开源生态的协同效应。相比之下，Grok的差异化优势在于其“实时数据接入”和“极端场景优化”——例如，它可调用SpaceX的卫星图像分析地质灾害，或结合特斯拉自动驾驶数据理解交通场景。
然而，挑战同样严峻。行业专家指出，多模态训练需消耗巨量算力，xAI目前仅拥有10万块H100显卡，远低于OpenAI和谷歌的百万级集群；此外，图像数据的版权和伦理问题也可能引发监管审查。马斯克则回应称，xAI正与特斯拉合作开发专用AI芯片，并计划通过“众包模式”鼓励用户上传合规图像数据。
商业化提速：Grok或重塑AI应用格局
若图像训练瓶颈突破，Grok的商业化前景将大幅拓宽。据xAI披露，其已与医疗、教育、制造业等领域的200家企业签署合作协议，例如协助医生分析X光片、为学生生成个性化学习方案，或为工厂设计自动化流程。马斯克预计，到2026年，Grok将覆盖全球1亿用户，创造“数百亿美元”年收入。
不过，他同时警告称，AI的指数级进化可能带来“失控风险”。“我们必须确保Grok的价值观与人类对齐。”马斯克强调，xAI已建立由哲学家、伦理学家和科学家组成的“红队”，持续监测模型偏见和安全隐患。
随着一个月倒计时开启，Grok能否补齐图像短板、巩固技术领先地位，将成为AI行业下半年最受关注的焦点之一。而马斯克“超越人类”的豪言，能否从实验室走向现实，或将重新定义智能时代的竞争规则。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

多模态大模型：让AI具备“眼耳口脑”全方位能力

马斯克宣布正式推出Grok 4

马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型

OpenAI研究员遭Meta高薪挖角

武汉大学成立机器人学院，将从小米、宇树等头部企业聘请10名产业教授

飞书AI，很激进又很克制

全站最新

这对科研伉俪，在国际顶刊《自然》携手发文

边缘计算，驱动智造变革｜iEi威强电邀您共赴第27届青岛国际工业自动化展览

吉峰科技正式易主：汪辉武时代匆匆谢幕，主营无人机的新主瞄上产品和渠道｜并购一线

零跑全新C11上市，配激光雷达、8295P芯片，买它还是Model Y？

热门推荐

独家｜前员工讲述Manus战略调整始末：本周一才正式通知，与阿里通义合作开发中文版或生变

多模态大模型：让AI具备“眼耳口脑”全方位能力

马斯克宣布正式推出Grok 4

马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型

OpenAI研究员遭Meta高薪挖角

武汉大学成立机器人学院，将从小米、宇树等头部企业聘请10名产业教授

飞书AI，很激进又很克制

大模型测评报告：用过大模型受访者比例提升22.9个百分点

AI大于互联网，英伟达大于AI

从迷雾到星河，爱奇艺如何助推网络视听“潮涌生辉”？

飞书搞了个AI分级体系，一上线就把一堆产品打回原形了

背靠四维图新+滴滴，四维智联IPO是突围还是续命？

马斯克发布Grok 4，编程能力受赞，20万GPU助力年赚47亿美金计划曝光

Grok 4号称“全球最强AI”？其实是马斯克的自吹自擂

微软称AI助其节约大量成本