头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • 多模态2025:技术路线“神仙打架”,视频生成冲上云霄

    为了解决这个问题,智源研究院早在去年10月上线了全球首个原生多模态世界大模型Emu3,试图将多种模态的数据统一在一个架构内。 在学界和业界探索技术道路的同时,企业端正在加速多模态大模型在行业中的落地进程,这…

    06/11
  • OpenAI 提升o3多模态模型推理实力,微美全息加速引领产业新变革征程

    资料显示,5G+AI视觉厂商微美全息,全面加速大模型技术迭代与产业落地,围绕大模型战略,全面升级AI矩阵,积极采用“自研+拥抱开源”双轨模式,重点布局多模态大模型(文本、图像、音频、视频原生级融合),并计划…

    06/10
  • 鼎捷数智股价上涨3.09% 推出多模态大模型开发平台

    鼎捷数智最新股价报36.42元,较前一交易日上涨1.09元,涨幅3.09%。盘中最高触及37.44元,最低35.68元,成交金额达4.52亿元。 该公司属于软件开发板块,专注于企业数字化解决方案。鼎捷数智推出…

    06/09
  • 中信建投:多模态产品密集更新,关注WWDC及字节火山大会进展

    中信建投表示,近期多模态动态更新密集。5月21日,谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型,实现AI视频音画同步;5月23日,豆包正式上线视频通话功能,支持实时视频交流及屏幕分享;6月6…

    06/09
  • 智源大会前线速写:多模态模型的“ChatGPT时刻”还未到来

    过去一两年间,多模态路线上先后出现OpenAI的视频生成模型Sora、4o图像生成功能等重要里程碑。在智源大会分论坛上,AI视觉领域的明星创企Luma AI首席科学家宋佳铭直言,“上下半场”的划分更像是在描述…

    06/08
  • 生数科技CEO骆怡航:从模型到生产,多模态AI如何推动视频创作更高效

    从用户覆盖里边,截止目前我们在 200 多个国家和地区超过 3,000 万的用户,企业客户包括了刚才提到的八大行业里边 2,000多家的客户在使用申诉科技的Vidu的产品,同时有 30 多家的生态合作伙伴也…

    06/08
  • 智源发布脑科学多模态通用基础模型等研究成果

    同时,作为整合大规模多模态数据的基础通用模型,Brainμ也可以支持拓展脑机接口应用,在与脑机接口企业强脑科技BrainCO的合作中,Brainμ实现了首次在便携式消费级脑电系统上重建感觉信号,展现了模型支…

    06/08
  • 杨飞提出基于多模态生态治理数据的知识图谱构建技术

    (文/李金廷)杨飞先生是一位在多模态技术领域具有杰出才能的专家,他在生态管理领域取得了重要突破,成功提出并发展了基于多模态生态治理数据的知识图谱构建技术。通过数据整合、知识抽取、知识融合等技术手段,杨飞团队…

    06/07
  • 预见 2025:《2025 年中国多模态大模型行业全景图谱》(附市场现状、竞争格局和发展趋势等)

    根据对已披露的部分国内外主要多模态大模型产品的收费模式的对比,目前按照 token 计价和订阅模式是行业最主流的收费模式,而从收费价格来看,由于整体多模态大模型行业仍处于探索阶段,而且各家多模态大模型产品的…

    06/06
  • 智源研究院发布全球首个原生多模态世界模型“悟界・Emu3”

    6 月 6日消息,北京智源人工智能研究院今日发布“悟界”系列大模型,包括全球首个原生多模态世界模型“悟界・Emu3”、全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”。据此前报…

    06/06
  • 机器人助力幸福生活|仿生多模态情感交互机器人“来了”

    “她”能进行视觉识别、能感觉人的情绪变化,通过多维度的自然表情和语音语义,能呈现丰富的情感表达。“她”就是EX公司研制的仿生多模态情感交互机器人。 借助AI技术,仿生多模态情感交互机器人具有视觉识别能力。在与…

    06/04
  • 字节 Seed 开源统一多模态理解和生成模型 BAGEL

    具体来看,BAGEL 基于大语言模型进行训练,具备基础的推理和对话能力,能够处理图像和文本的混合输入,并以混合格式输出。基于对视觉内容和风格的理解,BAGEL 仅使用较少的对齐数据,即可实现图片的风格切换…

    06/03
  • 小米开源多模态大模型MiMo-VL 称多方面优于Qwen2.5-VL-7B

    值得一提的是,MiMo-VL-7B 不仅在复杂图片推理和问答等任务上表现出色,还能够完成长达 10 多步的 GUI 操作,展示了其在Agent 时代的巨大潜力。此外,小米还采用了混合在线强化学习算法(Mi…

    05/30
  • 小米多模态大模型MiMo-VL开源,官方称多方面领先Qwen2.5-VL-7B

    其能够完成复杂图片推理和问答等任务,在长达 10 多步的 GUI 操作上,MiMo-VL-7B 也展示了不错的潜力,甚至能帮你加购小米 SU7至心愿单。 混合在线强化学习:混合文本推理、多模态感知 + …

    05/30
  • 中国自研AI实现历史性突破 云从科技超越谷歌OpenAI登顶多模态榜首

    首创融合DPO(直接偏好优化)与GRPO(生成式奖励优化)的双重对齐技术,无需依赖奖励模型即可实现类人化推理决策,通过优化模型学习机制,从容大模型实现了更贴近人类思维的决策方式,在复杂问答与多轮交互中展现出…

    05/29
  • Meta 发布 Multi-SpatialMLLM:多模态 AI 突破空间理解瓶颈

    在 MultiSPA 基准测试中,Multi-SpatialMLLM 相比基础模型平均提升 36%,在定性任务上的准确率达到80-90%,远超基础模型的 50%,甚至在预测相机移动向量等高难度任务上也取得…

    05/29
  • 多模态内容优化实战:AI-CRO技术应用全解析

    技术参数标注:为产品图添加ALT标签(如”XX空调1.5匹 新一级能效”),使图像搜索匹配准确率提升47%场景化语义关联:将安装流程图与”小户型空调安装注意事项”等长尾词关联,图文内容引用率提升300%知…

    05/29
  • 2025 年中国多模态大模型行业主要模型 主要多模态大模型处理能力表现出色

    BLIP ( Bootstrapping Language-lmage Pretraining ) 是由 Salesforce 在 2022 年提出的多模态预训练模型,它旨在统一视觉语言任务的理解与生成能力…

    05/22
  • 破局多模态数据治理难点,数据标注重构企业营销新基建

    在选择数据标注公司时,企业通常会从技术能力、服务质量、成本效率、数据合规等多个维度综合评估,筛选出与其业务需求高度匹配的数据标注合作伙伴,从而保障数据的高效性和可靠性,更好地满足商业应用的需要。对企业营销需…

    05/22
  • 破局多模态数据治理难点,数据标注重构企业营销新基建

    在选择数据标注公司时,企业通常会从技术能力、服务质量、成本效率、数据合规等多个维度综合评估,筛选出与其业务需求高度匹配的数据标注合作伙伴,从而保障数据的高效性和可靠性,更好地满足商业应用的需要。对企业营销需…

    05/22
  • 谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI

    5 月 21 日消息,今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据…

    05/21
  • 苹果StreamBridge视频模型框架问世,Meta/微美全息加速多模态AI技术创新

    与此同时,微美全息加速大模型在应用场景的落地速度,该企业陆续披露了旗下较成熟的AI生态图景,覆盖在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,为AI大模型应用注入强劲动力,正悄然化身成为…

    05/20
  • Ollama 上线自主多模态 AI 引擎:本地推理性能飙升

    Ollama 团队成员在 Hacker News 上澄清,Ollama 使用 golang 独立开发,未直接借鉴 llama.cpp 的C++ 实现,并感谢社区反馈改进技术。 因此 Ollama 推出全新…

    05/17
  • Ollama 上线自主多模态 AI 引擎:本地推理性能飙升

    Ollama 团队成员在 Hacker News 上澄清,Ollama 使用 golang 独立开发,未直接借鉴 llama.cpp的 C++实现,并感谢社区反馈改进技术。Ollama 还联合 NVIDI…

    05/17
  • 百度发布文心大模型4.5 Turbo/X1 Turbo:多模态、强推理、低成本

    4 月 25 日消息,在今日的百度 Create 开发者大会上,百度创始人李彦宏发布了文心大模型 4.5 Turbo,其相比文心4.5 速度更快、价格下降 80%,每百万 token 的输入价格仅…

    05/16
  • 教育部等部门:加快建设AI教育大模型,完善教育领域多模态语料库

    其中提到,加强人工智能等前瞻布局、加快建设人工智能教育大模型、完善教育领域多模态语料库,构建高质量自主可控数据集。布局一批前瞻性研究课题,有序开展人工智能应用试点,探索“人工智能+ 教育”应用场景新范式,推…

    05/16
  • 苹果联合研究照亮多模态 AI 未来方向:早期融合 + 稀疏架构

    团队对比了早期融合(early-fusion)和后期融合模型,发现从头训练时,两者性能相当,但早期融合模型在低计算预算下更高效且易于扩展。 结果表明,原生多模态模型的扩展规律与语言模型相似,但跨模态数据类型…

    05/16
  • 李彦宏百度AI开发者大会演讲实录:DeepSeek不是万能的,多模态将成未来标配

    今天,我们在1小时内做了有关模型和应用的9大发布——发布了更强大、成本更低的文心大模型4.5 Turbo和X1 Turbo;发布了领先一代的高说服力数字人、功能强大的沧舟OS系统、代码智能体秒哒的新进展、多…

    05/16
  • 慧科讯业AI赋能数据标签化,破局多模态数据治理难题

    数据标注与标签化对商业应用场景的价值不可小窥,但在实操过程中,海量多模态数据为业界创造了诸多的困难和挑战,例如:数据复杂度高、人工成本高昂、传统NLP不精准、LLM高成本低稳定、对业务应用理解不足等痛点。 …

    05/16
  • 文心快码Coding智能体Zulu正式发布:国内首个多模态AI程序员正式上岗

    武汉大学特色化示范性软件学院副院长谢晓园以“AI as Code Partner”为主题,探讨了从需求精化到API适配的人机智能协作开发范式;同程旅行工程效能部架构师杨方伟从研率效率实践维度切入,详细阐释了在…

    05/16
  •  «上一页   1   2   …   3   4   5   6   7   …   8   9   下一页»   共264条/9页 
    全部热门
  • 从代步到潮玩,奇瑞小车潮改节暨多米上市发布

    06/10 22:33

  • 售价12.98万-15.98万,一汽丰田bZ5诠释“合资

    06/10 22:02

  • “限时一口价”3.99万起 奇瑞多米/小蚂蚁喜爱

    06/10 21:30

  • 全新一代丰田RAV4将国产!提供多种设计风格,

    06/10 19:33

  • 618电竞装备升级指南:颜值性能一个都不能少

    06/10 17:02

  • 截胡骁龙8 Elite 2!曝天玑9500提前发:联发科

    06/10 17:01

  • 小米汽车工厂7月开放日来了!周末及节假日每天

    06/10 17:01

  • 泡泡涨价引争议,粉丝经济博弈平台或需筛选高

    06/09 17:34

  • 高考题,AI大模型不能解,也不敢解

    06/09 17:33

  • 公章争夺战落幕?海航控股7.99亿买回天羽飞训

    06/09 17:33

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号