当前位置：首页 » 资讯 » 新科技 » 正文

微软新专利展示音生图AI模型会议中可据演讲者话题实时更新背景图像

IP属地中国·北京 编辑：周伟太平洋科技 时间：2024-10-15 19:42:44

近日，微软取得了一项突破性专利，该专利技术能够将用户的实时语音输入转化为图片，为会议和讲座带来全新的视觉体验。根据专利描述，这项技术在会议或讲座场合中，能够实时捕捉音频，并通过先进的语言模型对内容进行总结，最终生成相应的AI图像。这一过程涉及三个主要环节：音频捕捉、文本处理和图像生成。
具体操作步骤如下：
捕捉音频：用户通过麦克风发言，系统实时记录并转换成文本。
处理文本：系统将文本分段，利用语言模型对每段内容进行总结。
生成图像：根据总结内容生成的提示，系统创建AI图像，并在屏幕上实时展示。
这项技术预计将主要应用于Microsoft Teams，能够根据演讲者话题的变化实时更新图像，提升视觉沟通效果。微软表示，这种图像辅助功能有助于更清晰地传达信息，尤其适合视觉学习者。
微软于2023年4月5日提交的这项专利，经过长达半年的审核，于10月获得美国商标和专利局的批准。该专利共包含20页内容，详细描述了如何将语音实时转化为图像的技术。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

北京东城区举办重点互联网企业东城行活动

OpenAI发现更多AI智能体失控迹象

Meta与贝莱德联手在德州埃尔帕索共建140亿美元AI数据中心

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

奥特曼也逃不过刷TikTok上瘾，Sora背后最抓马的一段来了

字节跳动启动AI业务组织调整飞书与豆包产品团队合并

全站最新

北京东城区举办重点互联网企业东城行活动

OpenAI发现更多AI智能体失控迹象

Meta与贝莱德联手在德州埃尔帕索共建140亿美元AI数据中心

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

热门推荐

中国信达等在广西成立新合伙企业出资额7.21亿

蚂蚁集团旗下公司等入股乐享智能

被AI包围的ChinaJoy：宇树携机器人热舞，AI漫剧首秀受热捧，老字号扎堆玩跨界

DeepSeek-V4-Flash正式API上线！Agent能力暴涨6倍，价格仅为Claude的1/90

北京东城区举办重点互联网企业东城行活动

OpenAI发现更多AI智能体失控迹象

Meta与贝莱德联手在德州埃尔帕索共建140亿美元AI数据中心

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

奥特曼也逃不过刷TikTok上瘾，Sora背后最抓马的一段来了

字节跳动启动AI业务组织调整飞书与豆包产品团队合并

AI 重构公司，字节肢解飞书，豆包接驳抖音

腾讯科研智能体攻破50年未解数学难题，姚顺雨喊话正在招人

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

美股收评：三大指数全线上涨！亚马逊暴涨15%，苹果跌超7%；芯片股盘中大跳水，中概股上涨；特朗普下令打击伊朗，原油尾盘直线拉升

摩托罗拉推出Moto Pad 70 Groove平板

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

微软新专利展示音生图AI模型会议中可据演讲者话题实时更新背景图像

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

微软新专利展示音生图AI模型 会议中可据演讲者话题实时更新背景图像

同类资讯

微软新专利展示音生图AI模型会议中可据演讲者话题实时更新背景图像