当前位置: 首页 » 资讯 » 新科技 » 正文

马斯克宣称Grok智能超越人类,图像训练短板待补:一个月内或迎关键突破

IP属地 中国·北京 编辑:陆辰风 大力财经 时间:2025-07-10 16:31:39

2025年7月10日,财联社电——在今日举行的xAI直播活动中,特斯拉与SpaceX创始人埃隆·马斯克公开表示,其旗下人工智能公司xAI开发的聊天机器人Grok已在“大多数领域展现出超越人类的智能水平”,但当前版本的Grok 4仍存在图像理解盲区,需通过改进后的图像训练模块优化,预计问题将在一个月内解决。

智能超越人类?马斯克抛出“AI里程碑”论断

马斯克在直播中直言:“Grok 4在逻辑推理、多模态交互和复杂任务处理上已显著优于普通人类,甚至在部分专业领域接近顶尖专家水平。”他举例称,Grok在科学文献分析、代码生成和实时决策等场景中表现突出,其训练效率较前代提升300%,响应速度缩短至0.8秒。

这一表述与马斯克长期倡导的“AI奇点论”一脉相承。他此前曾预测,到2025年底,AI将具备“超越人类所有领域”的通用智能(AGI),而Grok的进化路径正是这一愿景的实践载体。据xAI披露,Grok 4基于全球最大的开源数据集训练,参数量达10万亿级,支持中、英、法等20种语言,并接入Twitter(现X平台)实时数据流,具备“自我进化”能力。

图像训练成短板:盲区问题或一个月内攻克

尽管性能领先,马斯克坦言Grok 4仍存在“致命缺陷”——图像理解能力不足。他解释称,当前版本的Grok在处理抽象图像、复杂场景和动态视觉信息时,准确率较文本任务低40%以上,例如难以识别手绘草图中的隐喻含义,或区分照片中微小物体的功能属性。

“这就像一个天才数学家看不懂漫画书。”马斯克比喻道,“我们需要为Grok植入更强大的‘视觉大脑’。”据xAI技术团队透露,改进方案包括升级多模态大模型架构、引入3D空间感知算法,并扩充包含10亿张高分辨率图像的专用训练集。马斯克承诺,新版本将于“一个月内”完成部署,届时Grok将实现文本、图像、视频的跨模态无缝交互。

技术竞赛白热化:Grok能否后来居上?

当前,全球AI巨头正围绕多模态能力展开激烈角逐。OpenAI的GPT-4o已支持实时语音和图像生成,谷歌Gemini则通过“原生多模态”架构实现文本与图像的深度融合,而meta的Llama 3.1更强调开源生态的协同效应。相比之下,Grok的差异化优势在于其“实时数据接入”和“极端场景优化”——例如,它可调用SpaceX的卫星图像分析地质灾害,或结合特斯拉自动驾驶数据理解交通场景。

然而,挑战同样严峻。行业专家指出,多模态训练需消耗巨量算力,xAI目前仅拥有10万块H100显卡,远低于OpenAI和谷歌的百万级集群;此外,图像数据的版权和伦理问题也可能引发监管审查。马斯克则回应称,xAI正与特斯拉合作开发专用AI芯片,并计划通过“众包模式”鼓励用户上传合规图像数据。

商业化提速:Grok或重塑AI应用格局

若图像训练瓶颈突破,Grok的商业化前景将大幅拓宽。据xAI披露,其已与医疗、教育、制造业等领域的200家企业签署合作协议,例如协助医生分析X光片、为学生生成个性化学习方案,或为工厂设计自动化流程。马斯克预计,到2026年,Grok将覆盖全球1亿用户,创造“数百亿美元”年收入。

不过,他同时警告称,AI的指数级进化可能带来“失控风险”。“我们必须确保Grok的价值观与人类对齐。”马斯克强调,xAI已建立由哲学家、伦理学家和科学家组成的“红队”,持续监测模型偏见和安全隐患。

随着一个月倒计时开启,Grok能否补齐图像短板、巩固技术领先地位,将成为AI行业下半年最受关注的焦点之一。而马斯克“超越人类”的豪言,能否从实验室走向现实,或将重新定义智能时代的竞争规则。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。