英伟达否认H100/H200芯片短缺传闻,可满足所有订单需求
汽势Auto-First|撒马尔
刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大
腾讯混元开源轻量级翻译模型:支持5种汉语言与方言互译
美团正式发布并开源其首款大模型LongCat-Flash,这款总参数达5600亿的混合专家模型(MoE)在推理效率上实现重大突破,理论每token输出速度较DeepSeek-V3提升近50%,性能指标全面追…
LongCat-Flash团队在30项基准测试上评估了模型的能力,可以看到,Agent任务是这一模型能力的“长板”,相较DeepSeek-V3.1、Qwen3 MoE-2507和Kimi-K2等国产开源有明…
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
美团正式发布并开源LongCat-Flash-Chat
电车头上的犄角,终于没了?
百度正加速把智能云推向AI商业化前台。
预计不会对芯片设计进行过大改动
这款新车长宽高分别为5130/1966/1500或1492mm,轴距来到3020mm
以后其他推理模型,要么选择DS这套体系,要么选择英伟达体系
一体化快堆关键技术攻关取得重要突破,为推动一体化快堆的设计研发提供了有力保障。
华为云大地震:多个部门将被裁撤整合
特斯拉FSD V14更新将至,马斯克称其“感觉像是有生命”
火山方舟提供的DeepSeek-V3.1版本效果与DeepSeek官方API保持高度一致。
GPT-5变蠢背后:抑制AI的幻觉,反而让模型没用了?
情绪价值可以折换为价格,但不应该被用来合理化这种毫无体面的割韭菜行为。
强化学习训练数据则涵盖了STEM问题、代码任务等四大类,其中数学数据因其强大的泛化能力,能够广泛提升模型在各任务中的性能。评估结果显示,在数学推理领域,Seed1.5-Thinking在AIME 2024中…
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22