AI大模型公司Anthropic联合创始人兼首席计算官TomBrown当地时间12月2日宣布,公司旗下下一代的Claude模型将在Project Rainier上进行训练,他表示这将是一个新的亚马逊集群,拥…
据微信公众号“腾讯云”消息,12月3日,腾讯正式发布了腾讯混元文生视频大模型,支持中英文双语输入、多种视频尺寸及多种清晰度。我们用该模型生成了一段小视频。提示词为:两只小猫在打闹,写实风格。 目前,该…
和GENN-3 alpha(Web)相比,腾讯混元视频生成模型的持续时间少一秒,文本对齐高14.1个百分点,运动质量高11.8个百分点,视觉质量持平。目前,腾讯混元已开源旗下文生文、文生图和3D生成大模型。业…
12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。 除了基础的视频生成能力外,腾讯还拓展了HunYuan-Video的应用功能,推出了视频…
本次大会上,中国电信发布及更新了昆仑云网能力开放平台、“息壤”算力服务、视觉大模型及文生视频大模型、“星海”数据智能中台和灵泽”数据要素平台、AI手机、量子计算机等方面的进展。 在一站式智算服务方面,面向国…
该模型的参数量高达130亿,成为当前最大的视频开源模型。 混元大模型支持中英文双语输入,并具备“超写实”的视频生成能力,画面质量高,不易变形。在镜面或镜子场景中,模型能实现镜面反射动作与外部场景的完全同步,光…
混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备强大的语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现;采用统一的全注意力机制,使得每帧视频的衔接更为流畅,并能实现主体一致的多视角…
12月3日消息,腾讯混元大模型公布最新进展:正式上线视频生成能力,这是继文生文、文生图、3D生成之后的又一新里程碑。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型。“用户…
腾讯混元视频生成大模型可以生成超写实的高质量视频,比如,像冲浪、跳舞这种大动作场景,生成的画面自然合理,不容易变形。 适配了新一代文本编码器提升语义遵循,其具备强大的语义跟随能力,更好地应对多个主体描绘,实…
官方宣称,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律。▲ 提示词:超大水管浪尖,冲浪者在…
我们在 18K 生成图像 (RichHF18K) 上收集如此丰富的人类反馈,并训练多模态转换器来自动预测丰富的反馈。我们表明,可以利用预测的丰富人类反馈来改进图像生成,例如,通过选择高质量的训练数据来微调和改…
允许使用范围与原则包括:“征得指导教师同意的前提下,且当 AI工具生成的内容不影响对学生在毕业论文(设计)中的创新等能力的考察时,作者可在以下范围内使用 AI 工具:文献检索与整理、二次创作图表类型推荐与…
11 月 8 日消息,科技媒体 MacRumors 昨日(11 月 7 日)发布博文,报道称在 iOS 18.2 更新中,图片生成AI 工具 Image Playground 并未带来今年 6 月…
11 月 5 日消息,腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 …
AI 文生图领域的主流工具一直是 Midjourney 与 Stable Diffusion,设计师或 AI爱好者可以通过提示词生成想要的图像。 目前,基石智算(coreshub.cn)已上架内置 FLU…
10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的扩散模型架构OmniGen,这是一种用于统一图像生成的多模态模型。 ▲ 文本生成图像,编辑生成图像的部分元素,根据生成图像的人体…
10 月 27 日消息,OpenAI 本周公布了一款名为 sCM(Continuous-Time ConsistencyModel)的新型 AI 文生图方案。 与传统的扩散模型相比,sCM 仅需两…
该模型拥有80亿参数,提供了卓越的图像质量和快速的响应时间。适用于100万像素分辨率的专业应用场景,Stable Diffusion 3.5Large在性能上超越了同类竞争对手,成为Stable Diff…
谷歌 DeepMind 和 MIT 团队通过深入研究,发现了使用连续 tokens(非离散tokens)和采用随机生成顺序(非固定顺序)两个关键设计因素,显著提高了自回归模型的性能和可扩展性。 Fluid…
自回归模型 (Autoregressive Models): 自回归模型预测序列中的下一个元素时,依赖于前面的元素。 Fluid模型结合了连续标记和随机生成顺序后,当其规模扩大到 105 亿参数时,Fl…
10 月 14 日消息,智谱技术团队今天宣布开源文生图模型 CogView3 及 CogView3-Plus-3B,该系列模型的能力已经上线“智谱清言”App。 官方表示,在实际效果上,CogView3 在…
10 月 14 日消息,智谱技术团队今天宣布开源文生图模型CogView3 及 CogView3-Plus-3B,该系列模型的能力已经上线“智谱清言”App。 官方表示,在实际效果上,CogVie…
10 月 12 日消息,由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧…
10 月 4 日消息,OpenAI 的文生视频大模型 Sora 团队研发负责人 Tim Brooks(蒂姆・布鲁克斯)于当地时间 10月 4 日宣布离职,加入谷歌 DeepMind。 Tim Br…
在与 Ideogram v2 和 Midjourney v6.1 等竞争对手的基准比较中,Black Forest Labs 报告称 Flux1.1 Pro 在大多数指标上表现更好,特别是在提示遵循和连贯…
在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0和 blueberry_1力压Flux.1、Ideogramv2、Midjourney v6.1等知名模型,成为最新榜一榜二大哥。 我…
核心亮点是采用了运算能力大幅提升的M5芯片,替代了目前的M2芯片,这一升级将确保用户获得更优质的Apple Intelligence体验。若新机种能创造吸引人的用户体验,苹果的头显和空间计算技术有望成为主流产…
9月24日消息,据TechCrunch9月21日报道,德国AI文生图模型创企Black ForestLabs正在完成新一轮融资,预计筹集1亿美元资金,希望达到10亿美元的估值。 已经筹集了超过5亿美…
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22