此外,该模型在 GPQA 和 AIME 2025 等数学和科学基准测试中也全面领先,超越了 Claude3.7、Grok3、GPT4.5、DeepSeek-R1 等一众顶尖模型。 谷歌高级研究员 Jeff …
今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。 近日,DeepSeek官方宣布V3模型完成小版本升级…
2024年,交银国际的资产管理规模总额约为181.56亿港元,同比港元减少5.8%;截至2024年12月31日止年度,资产管理及顾问服务费收入3680万港元,同比增长2.5%;自营交易收益为1000万港元,…
3月19日消息,LG AI Research昨日(3月18日)发布博文,宣布推出EXAONE Deep,定位为“智能体型AI(Agentic AI)”,能够自主提出并验证假设,这也是韩国首个开源推理AI模型。…
这一模型揭示了大脑海马体中位置细胞在构建空间地图时的活动模式。过去的研究普遍认为,在狭小环境中,位置细胞会在单一紧凑的空间区域内以对称形状放电。最新的研究发现,在较大范围的环境中,这些细胞表现出更为复杂且不规…
同样是国内当前最强,也是最受关注的两款深度推理大模型,星火 X1 和 DeepSeek R1 的数学能力究竟谁强谁弱? 今天我们做一个简单PK。 从以上简单测试来看,讯飞星火深度推理大模型 X1 升级版和…
我们在星火X1升级后的第一时间,将其数学能力和DeepSeek做了简单对比,用的5道测试题含金量颇高,全部来自《2024年全国统一高考数学试卷(新高考Ⅰ)》,两大模型答卷情况如下: 星火X1解答正确,Dee…
本着一视同仁的原则,每题10分,满分100,以最后得分多者为胜,看看星火X1升级版和DeepSeek R1谁才是数学殿堂里的王者。 星火X1完美给出了三小题的答案,得10分,DeepSeek给出的答案中(1)…
近日,由双方共同参与的“新课标背景下,如何利用知识图谱个性化培养学生的数学学科能力与核心素养”课题签约仪式在北京顺利举行,多位来自数学教学和人工智能领域的专家学者见证了这一重要时刻。 科大讯飞AI学习机非常关…
目前星火医疗大模型 X1 正式应用于 AI健康助手“讯飞晓医”,与个人健康档案的融合更加深入,在用户健康咨询时,它能深度洞察用户健康状况并思考潜在需求,解决了过往 AI 医疗咨询中“建议答案宽泛不实用”的…
他连续三次参加高考,后来是靠着英语特长,才上了大学。 穷则思变,因此努力上进的俞敏洪,实现了“笨鸟先飞”;勇于开拓,聪明大胆的刘强东多次“卷土重来”;擅于发挥特长,狡猾的马云,明明数学成绩稀巴烂,最终却靠着英…
更令人兴奋的是,他们计划基于开源软件许可证Apache2.0,开放QwQ-Max和Qwen2.5-Max的权重,这无疑将为AI领域注入新的活力和创新动力。 Qwen团队还表示,他们正在研发更小型的模型,如Q…
吴宇怀初中时期的数学老师陆韵也向南都记者表示,在数学学科上,他始终很有钻研精神。公开信息显示,2023年7月,马斯克曾高调官宣xAI创始团队12人,其中有5位都是华人面孔,除了吴宇怀外,还有另外一位在Gro…
马斯克发布会上自豪的一点是,Grok 3“思考模型”下的逻辑推理能力,他声称,Grok 3 (Think)学会了改进其解决问题的策略,通过回溯纠正错误,简化步骤,并利用其在预训练期间获得的知识。 之后,每…
根据官方公开的测试结果,Grok 3在包括AIME(评估模型在一系列数学问题上的表现)和GPQA(评估模型在博士级别的物理学、生物学和化学问题上的表现)等基准测试中,远超 GPT-4o、Gemini-2 …
所以,现场他们让Grok-3制作了一个结合了俄罗斯方块和宝石迷阵两个游戏的混合体,这次他们使用了「Big Brain」模式,可以使用更多计算能力的一种模式。研究者表示,我们花了24个月去打磨这个模型,确定它…
新浪科技讯 2月18日午间消息,马斯克宣布Grok 3发布,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gem…
快科技1月15日消息,讯飞星火4.0 Turbo今日正式升级,七大能力全面超过GPT-4 Turbo。 据介绍,讯飞星火4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能…
【快讯】1月15日,科大讯飞宣布其AI模型讯飞星火4.0Turbo底座能力重大升级,在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力方面均实现了显著提升。 在数学能力方面…
至于最重要的底座能力这块,讯飞星火 4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面全面提升,并且图文识别能力也迎来了升级,现在即便是倾斜少线的表格也能够正常…
1月15日消息,讯飞星火4.0 Turbo今日正式升级,七大能力全面超过GPT-4 Turbo。 据介绍,讯飞星火4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力迎来…
1月15日消息,讯飞星火4.0 Turbo今日正式升级,七大能力全面超过GPT-4 Turbo。 据介绍,讯飞星火4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能…
研究人员要求模型输出自然语言描述和 Python 代码形式的“思维链”步骤,并将自然语言作为 Python 代码注释,仅使用 Python代码输出训练模型。 研究人员使用了 74 万道公开的数学应用题及其…
近日,广东一楼盘推出“9块9买房”活动在网上刷屏。 9日,深圳南山“期末试卷太难延时20分钟”冲上热搜。近日,在SM公司30周年演唱会上,泰妍、Wendy表达了对公司的不满。 1月9日早高峰,比亚迪APP…
韦东奕,大家都熟悉,被人戏称为“韦神”的数学天才,但是很多网友似乎根本就不知道数学和计算机的区别,以为韦神就是上知天文下知地理,什么难题都能解决的高手了。韦东奕的领域是数学,虽然在高校里数学会学一定的计算机方…
【综合报道】12月25日,阿里云通义千问发布开源多模态推理模型QVQ-72B-Preview。 目前,QVQ-72B-Preview已在魔搭社区和HuggingFace等平台上开源,开发者可上手体验…
Phi-4 是 Phi 系列小型语言模型的最新成员,官方表示其展示了微软继续探索 SLM 边界的可能性。 微软宣布,将“强大且负责任”的 AI能力提供给所有使用 Phi 系列模型(包括 Phi-3.5-mi…
12 月 13 日消息,微软今天宣布推出 14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4 是 Phi 系列小型语言模型的最新成…
06/10 22:33
06/10 22:02
06/10 21:30
06/10 19:33
06/10 17:02
06/10 17:01
06/09 17:34
06/09 17:33