像DeepSeek-R1这样的模型已经展现出了令人印象深刻的推理能力,但其训练方法和数据集并未公开,这为研究界带来了巨大困扰。更令人惊喜的是,模型在这个过程中自发发展出了多种复杂的推理行为。 研究团队对强化…
在科技界引发轰动的一则消息中,OpenAI的研究员Sheryl Hsu宣布了一项里程碑式的成就:其内部研发的AI推理系统在国际信息学奥林匹克竞赛(IOI)中荣获金牌,这是2025年的赛事中首次有AI达到这一高…
文心大模型4.5是百度首个原生多模态大模型,多项测试表现优于GPT4.5
开源扣子核心能力,开放模型微调框架等技术模块以降低开发门槛
目前,该模型已在魔搭社区和HuggingFace平台全面开源。
Qwen3新模型已在魔搭社区和HuggingFace上开源更新。
百度已于6月30日开源了文心大模型4.5系列。
目前,Psych-101数据集和Centaur模型已全部开放。
研究表明,AI 已快速发展,具备诊断疾病、创作诗歌甚至驾驶汽车等多项实用技能,但对“no”和“not”等否定词,却束手无策。Katanforoosh 警告,AI 对否定的误解不仅是一项技术缺陷,更可能在法…
5 月 22日消息,麻省理工学院(MIT)最新研究表明,人工智能(AI)在理解“no”和“not”等否定词方面仍存在明显缺陷,在医疗等关键领域可能引发严重风险。Katanforoosh 警告,A…
据介绍,Skywork o1 是由昆仑万维集团发布的具有“慢思考推理能力”的系列模型,是国内第一款具备中文逻辑推理能力的 o1模型。不同于现有的复现 OpenAI o1 模型的工作,Skywork o1 …
近日,昆仑万维宣布,其研发的国内首款具备中文逻辑推理能力的o1模型——“天工大模型4.0 O1版”(英文名:SkyworkO1)将于11月27日正式启动邀请测试。 天工大模型4.0 O1版的逻辑推理能力是其…
尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也会急剧下降。在论文中,研究人员通过一个简单的数学问题证明了这一点。 但是,一…
于2002年8月由博客教父方兴东创立。作为中国博客发源地,汇聚国内众多具新锐思想的意见领袖,是中国最具影响力的博客平台。“每天5分钟,给思想加油”是我们的宗旨!
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22