头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • ICLR 2026|早于DeepSeek Engram,STEM已重构Transformer记忆

    03/09
  • ​超越 Transformer 架构?Inception 发布全球首个基于扩散模型的推理大模型 Mercury 2

    02/25
  • 一图解读AI大模型基石:Transformer

    Transformer是2017年由谷歌团队提出的一种革命性神经网络架构,其核心创新在于摒弃了传统的循环神经网络(RNN),完全依赖“自注意力机制”来处理序列数据。它不仅是BERT、GPT等几乎所有现代大语言…

    02/21
  • 一图解读AI大模型基石:Transformer

    Transformer是2017年由谷歌团队提出的一种革命性神经网络架构,其核心创新在于摒弃了传统的循环神经网络(RNN),完全依赖“自注意力机制”来处理序列数据。它不仅是BERT、GPT等几乎所有现代大语言…

    02/21
  • 华为诺亚实验室:非平滑组件提升Vision Transformer学习效率

    这些理论分析不仅为实验观察提供了数学基础,更重要的是揭示了不同组件在学习过程中扮演的不同角色。研究结果显示,无论是预处理自注意力的LN1还是预处理前馈网络的LN2,它们的可塑性都明显低于其他组件,这解释了为…

    02/11
  • 华为诺亚实验室:非平滑组件提升Vision Transformer学习效率

    这些理论分析不仅为实验观察提供了数学基础,更重要的是揭示了不同组件在学习过程中扮演的不同角色。研究结果显示,无论是预处理自注意力的LN1还是预处理前馈网络的LN2,它们的可塑性都明显低于其他组件,这解释了为…

    02/11
  • 清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习

    02/10
  • 华为诺亚实验室:非平滑组件提升Vision Transformer学习效率

    02/10
  • 挑战Transformer,前OpenAI研究VP宣布创业,拟融资10亿美元

    02/02
  • 挑战Transformer,前OpenAI研究VP宣布创业,拟融资10亿美元

    02/02
  • 非Transformer架构新突破,液态神经网络推理小模型只用900M内存

    01/21
  • 马斯克刚刚真把 平台推荐算法开源,核心也是Transformer

    01/20
  • Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间

    通往AGI的道路不止一条

    01/18
  • Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间

    通往AGI的道路不止一条

    01/18
  • Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间

    通往AGI的道路不止一条

    01/17
  • 把RoPE扔掉,AI更能看懂长上下文!Transformer作者团队开源大模型预训练新方法

    而到了推理阶段,则大胆地丢弃位置嵌入,并在原上下文长度下进行简短的重新校准。 研究团队在多个模型上进行了实验,包括从零开始训练的5M参数模型、SmolLM家族模型(360M/1.7B)以及7B参数的Llam…

    01/14
  • 把RoPE扔掉,AI更能看懂长上下文!Transformer作者团队开源大模型预训练新方法

    而到了推理阶段,则大胆地丢弃位置嵌入,并在原上下文长度下进行简短的重新校准。 研究团队在多个模型上进行了实验,包括从零开始训练的5M参数模型、SmolLM家族模型(360M/1.7B)以及7B参数的Llam…

    01/14
  • 梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

    01/13
  • Transformer已死?DeepMind正在押注另一条AGI路线

    01/09
  • Transformer已死?DeepMind正在押注另一条AGI路线

    01/08
  • LSTM之父造出PoPE:终结RoPE泛化难题,实现Transformer极坐标进化

    01/04
  • Transformer能否支撑下一代Agent?

    12/22
  • 「背叛」Scaling Law?两位Transformer作者撬动美国开源AI革命

    12/19
  • AI大牛张祥雨:Transformer撑不起Agent时代

    12/18
  • 谷歌创始人布林:当年发完Transformer论文,我们太不当回事了

    12/15
  • 谷歌创始人布林:当年发完Transformer论文,我们太不当回事了

    谷歌创始人布林:当年发完Transformer论文,我们太不当回事了

    12/14
  • GPT在模仿人类?Nature发现:大脑才是最早的Transformer!

    12/11
  • 谷歌祭出Transformer杀手,8年首次大突破!掌门人划出AGI死线

    也许,AGI正加速到来

    12/07
  • 谷歌祭出Transformer杀手,8年首次大突破!掌门人划出AGI死线

    12/07
  • 华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升

    12/06
  •  «上一页   1   2   …   3   4   下一页»   共102条/4页 
    全部热门
  • 环球音乐集团与网易云音乐宣布达成多年期授权

    01/20 14:04

  • X平台正式开源推荐算法,马斯克称没有其他社交

    01/20 14:04

  • 黑芝麻智能(02533.HK)1月19日耗资600.02万港元

    01/20 13:53

  • 南戈壁(01878.HK)因购股权获行使发行5万股

    01/20 13:53

  • 中国中免(01880.HK)拟收购DFS大中华区零售业务

    01/20 13:53

  • 鸣鸣很忙(01768.HK)1月20日起招股 发售价每股2

    01/20 13:53

  • 鸣鸣很忙(01768.HK)预计1月28日上市 引入腾讯

    01/20 13:53

  • 中集安瑞科(03899.HK)拟配售最多合共7970万股

    01/20 13:53

  • 洛阳钼业(03993.HK)拟发行12亿美元于2027年到

    01/20 13:53

  • 欧康维视生物-B(01477.HK):OT-703于海南博鳌

    01/20 13:53

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号