头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • 结构为王:AI 推理新思路,思维链结构成突破 LLM 高效训练关键

    研究团队提出了一种新的训练方法,仅使用 17000 个 CoT 示例,微调 Qwen2.5-32B-Instruct 模型,并结合了 SFT和 LoRA 微调技术,强调优化推理步骤的结构完整性而非内容本身…

    02/15
  • Nullmax多款智驾产品亮相CES 2025,携手伙伴共推城区智驾与舱驾一体

    当地时间1月7日-10日,汇聚全球科技创新的CES2025在拉斯维加斯盛大举办,Nullmax以平台化技术打造的多款拥有城区功能的舱驾一体和行泊一体智驾产品,在合作伙伴的展台进行了现场展示。 Nullmax…

    01/15
  • AI版权案首例?Meta被指控用盗版网站数据训练LLM

    外媒称,这起案件开创了科技公司因使用盗版内容训练AI而面临版权诉讼的先河。证据表明,Meta从LibGen这一盗版书籍、杂志和学术论文的大型资源库中获取了内容。 值得注意的是,这并不是大型科技公司首次面临使…

    01/14
  • 绿联预告 CES 2025 发布 AI NAS 新品,搭载 LLM 语言模型

    1 月 3 日消息,绿联宣布将参加 CES 2025 全球消费电子展。 绿联 NAS 北美地区经理 Hernan Lopez将介绍最新一代的绿联 AI NAS,公布绿联在 AI NAS 领域的最新…

    01/03
  • 谷歌发布首个通用推理模型 登顶Chatbot Arena LLM排行榜

    谷歌DeepMind首席科学家Jeff Dean和产品负责人LoganKilpatrick分别通过视频演示了模型在物理问题和多模态信息处理方面的应用。 目前,Gemini 2.0 Flash Thinkin…

    12/20
  • Grammarly 收购 AI 公司 Coda,将为企业推出大模型 LLM 助手

    12 月 20 日消息,IT之家的小伙伴们可能有用过Grammarly工具提供的“语法检测”服务,这一工具对于英文书信等场合较为友好,而根据Grammarly官方新闻稿,该公司现已收购一家AI初创公司 Co…

    12/20
  • Grammarly 收购 AI 公司 Coda,将为企业推出大模型 LLM 助手

    12 月 20 日消息,的小伙伴们可能有用过 Grammarly工具提供的“语法检测”服务,这一工具对于英文书信等场合较为友好,而根据 Grammarly 官方新闻稿,该公司现已收购一家 …

    12/20
  • 苹果、英伟达强强联手,LLM 推理加速利器 ReDrafter 开源

    苹果公司表示 ReDrafter 已集成到 NVIDIA TensorRT-LLM 推理加速框架中,在 NVIDIA GPU 上,每秒生成tokens 速度最高提升 2.7 倍,有效降低了用户延迟和计算成…

    12/19
  • AGI、GAI、LLM怎么翻译:一大波人工智能外语词“中文名”出炉!

    12月10日消息,据媒体报道,近日,外语中文译写规范部际联席会议专家委员会审议通过第十六批18组推荐使用外语词中文译名。本次拟推荐使用的外语词中文译名,均为与人工智能、信息技术等相关的词条。 其中在人…

    12/11
  • AGI、GAI、LLM怎么翻译:一大波人工智能外语词“中文名”出炉!

    12月10日消息,据媒体报道,近日,外语中文译写规范部际联席会议专家委员会审议通过第十六批18组推荐使用外语词中文译名。本次拟推荐使用的外语词中文译名,均为与人工智能、信息技术等相关的词条。 其中在人…

    12/10
  • 翻译 50 种语言,精准识别情绪!音频大模型 FunAudioLLM 上线基石智算

    FunAudioLLM 是阿里巴巴通义实验室推出的一款开源语音大模型,它包含两个核心模型:SenseVoice 和 CosyVoice 。3s 极速复刻:上传自己的音频文件或在线录制音频,模型会根据你的音…

    12/06
  • 中能拾贝:IDC报告中的工业大模型新秀,拾贝云CyberwLLM领跑行业

    其中,采矿、电力行业应用较多的是视觉模型泛化增强,用大量数据训练视觉大模型,使模型具备更强的场景泛化识别能力,提升检验准确率,减少缺陷样本需求,缩短项目冷启动时间,应用于产品质检、安全监测复判等环节。 依靠…

    12/03
  • 中能拾贝:IDC报告中的工业大模型新秀,拾贝云CyberwLLM领跑行业

    其中,采矿、电力行业应用较多的是视觉模型泛化增强,用大量数据训练视觉大模型,使模型具备更强的场景泛化识别能力,提升检验准确率,减少缺陷样本需求,缩短项目冷启动时间,应用于产品质检、安全监测复判等环节。 依靠…

    12/03
  • 曝苹果正在研发“LLM Siri” 剑指ChatGPT等聊天机器人

    据彭博社消息,苹果公司正在研发一款更智能的Siri版本,内部员工称之为“LLM Siri”,旨在通过采用“先进的大型语言模型”来更好地与ChatGPT等聊天机器人竞争。大型语言模型的应用还…

    11/22
  • LLM 数学基准测试集 FrontierMath 公布:号称业界模型均败北

    11 月 15 日消息,研究机构 Epoch AI 现公布了一款名为 FrontierMath 的全新 AI模型数学基准测试集,旨在评估系列模型的数学推理能力。 与现有诸如 GSM-8K、MATH…

    11/15
  • Meta公布MobileLLM 1.5B参数量大、性能强

    11 月 8 日,Meta 公布了他们在智能手机上运行的 Small LanguageModel (MobileLLM) 家族的开源计划。他们新增了 …

    11/08
  • 国产显卡加速替代CUDA 摩尔线程开源vLLM-MUSA

    近日,摩尔线程在推动国产GPU AI发展方面迈出了重要一步,正式上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本。这一举措为开发者提供了基于摩尔线程全功能GPU进行MUSA移植的范例,有助于进…

    11/06
  • 加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI

    快科技11月5日消息,近日,摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。 摩尔线程通过MUSA软件栈对CUDA软…

    11/05
  • 摩尔线程开源 vLLM-MUSA,通过 MUSA 软件栈对 CUDA 接口兼容

    11 月 5 日消息,摩尔线程官方今日发文,称已上线了大语言模型高速推理框架开源项目 vLLM 的 MUSA移植版本,为开发者提供一个基于摩尔线程全功能 GPU 进行开源项目 MUSA 移植的范例…

    11/05
  • SafeBench:多模态大模型安全评估框架,揭示MLLM安全隐患

    目前,SafeBench 的代码和数据集已经在 GitHub开源(项目地址:https://safebench-mm.github.io/),研究团队希望借此推动 MLLMs 安全性的持续改进与发展,以减…

    10/26
  • 苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理

    尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也会急剧下降。在论文中,研究人员通过一个简单的数学问题证明了这一点。 但是,一…

    10/13
  • 用最直观的动画,讲解LLM如何存储事实,3Blue1Brown的这个视频又火了

    虽然这篇论文并未完全解答有关 LLM事实存储的问题,但也得到了一些颇为有趣的结果,其中的一个重点是:事实保存在网络中的一个特定部分,这个部分也就是我们熟知的多层感知器(MLP)。 现在,如果该空间中有一个…

    09/25
  • 最强笔记软件Obsidian中也能使用LLM,让它成为你的智慧第二大脑

    这里用到了 BMO Chatbot 这个插件,其能以聊天机器人的形式将 LLM 整合进你的 Obsidian。对我们大多数人来说,本地计算机能够运行的 LLM 的性能自然无法与 OpenAI 等大公司提供…

    09/25
  • 刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限

    在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。通过向模型教导自…

    09/25
  • 「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

    在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。 「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史…

    09/25
  • 昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

    该论文的核心亮点是,其中提出的分子忆阻器在核心的矩阵运算上能实现远超电子器件效率的 14 bit 模拟计算;并且其实现了超过 73 dB的信噪比,比之前的最佳水平直接高出了 4 个数量级,同时其能耗量比电…

    09/25
  • 从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

    该调查介绍了已提出的框架,然后对每个框架的技术、处理平台(FPGA、ASIC、内存、GPU)、加速、能源效率、性能(GOP)等进行了定性和定量比较。2021年,Jiarui Fang 和 Yang Yu 推…

    09/25
  • Agentic Workflow新范式,基于LLM的工作流、业务流程、智能体大融合

    事实上,从工作流和业务流程的定义来看,工作流更侧重于具体任务的执行和流程自动化,但接下来基于大语言模型的BPM也将Agent化,业务流程的整体规划、部署及运行也将在Agent的赋能下变得更加自主和智能,同样…

    08/31
  • LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

    【导读】Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的强大能力蒸馏到本地模型中,以应对文本图学习中的…

    08/22
  • LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

    对此,研究人员使用AgentInstruct,创建了2500万对「后训练」数据集,涵盖了多种使用技能,如文本编辑、创意写作、工具使用、编码、阅读理解等。 智能体可以生成高质量的数据,通过反思和迭代,其能力反…

    08/19
  •  «上一页   1   2   …  3   4   下一页»   共101条/4页 
    全部热门
  • 从大模型到Agent:百度GenFlow2.0,定义新赛点

    08/20 10:25

  • 搜索引擎可能完蛋,但谷歌的广告费一分不少。

    08/20 10:25

  • 网友吐槽总打断李想说话,罗永浩:感谢提醒

    08/20 10:24

  • 马云时隔六年再访蚂蚁森林:和树比高

    08/20 10:24

  • 社保基金最新持仓披露 重仓89股 青睐基础化工

    08/20 10:23

  • 炎热的夏天,火热的牛市,能否持续?

    08/20 10:23

  • 奥美森:自称无具体产能数据陷“罗生门” 产品

    08/20 10:23

  • 吸引力增强 外资看多做多中国股市

    08/20 10:22

  • 暴增103%!赣州“前首富”,即将翻身

    08/20 10:22

  • 中国OTA「分野」:为什么大众旅游更有含金量?

    08/20 10:22

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号