当前位置：首页 » 资讯 » 新科技 » 正文

谷歌做了个论文专用版nano banana！顶会级Figure直出

IP属地中国·北京 机器之心Pro 时间：2026-02-05 16:17:29

编辑｜SIA
你负责写方法，AI负责画 Figure。科研打工人，终于等来「画图解放日」。
还在为论文里的方法框图熬夜画 PPT、拉箭头、对齐字体吗？
一张 Figure 2，动辄几个小时，严重的甚至能耗上几天，科研人的「隐藏副本」不是实验，而是画图。
既要忠于论文原意，又得暗暗符合顶会那套心照不宣的「学术审美」：颜色不能土，布局不能乱，箭头更不能连错。
看起来只是一张图，实际上是美学、逻辑和耐心的三重折磨。
那么，问题来了：现在的大模型已经能写论文、跑实验、改代码，为什么偏偏搞不定这些学术插图？有人可能会问：DALL·E、基础 VLM 不行吗？
答案是：真不行。
它们画出来的图往往是：模块和文字对不上、字体直接乱码、箭头逻辑错误。图是「好看」，但不中用啊。
于是，一个狠角色出现了：PaperBanana
来自北大 + Google Cloud AI Research 的团队，目标很简单也很狂：你写方法，AI 画 Figure，水准呢？直接投顶会的那种。
科研打工人，终于等到了「画图解放日」。

来看效果成色。
PaperBanana 展示了解决两类学术插图的能力：
第一类，是论文方法流程图与模型结构示意图，用来说明算法如何运作（左）；第二类，是统计图表，用来表达实验结果与数据对比（右边）。

左边是方法框图（Methodology Diagrams），右边是统计图（Statistical Plots）
与以往「只会画图像」的生成模型不同，PaperBanana 强调两点：不是只要「画得好看」，而是必须「画得正确」。
它要保证：模块之间的逻辑关系不出错、数据表达符合科研规范、图可以直接服务论文叙事，而不是装饰。
研究指出，PaperBanana 可以覆盖多种常见学术插图类型，包括方法流程图、模型结构示意图、概念性框架图，以及通过代码驱动生成的高精度统计图。
PaperBanana 不仅能从零生成，还能润色你现有的丑图。
给它一张草图或初版框图，它负责自动美化、重排布局、统一风格，让它更像顶会论文里的标准图形
更直观的对比——
左侧是手工绘制的插图，右侧是 PaperBanana 风格增强（Style Enhanced）后的版本。

这些示例覆盖了多个典型科研场景，包括 Transformer 与不同 LayerNorm 变体的对比示意、工程流程与三维建模管线的系统框架，以及强化学习和表示学习中抽象几何关系的表达。它们的共同特点在于逻辑复杂、元素密集，对人工排版提出了极高要求，也正是科研人员最容易在“画图”上消耗大量时间与精力的部分。
语义结构上一致，但视觉呈现，完全不同。
原始图信息完整，却给人一种「能看懂，但不好看」的感觉：布局略显松散，配色偏向单一，不同模块之间的层级关系也不够清晰。
PaperBanana 润色增后，图中的逻辑被重新梳理进一套更规范的视觉体系之中。
不同功能模块通过颜色进行区分，虚线和分区框用来强化层次结构，箭头的走向也更加明确，整体观感明显更接近顶会论文中常见的标准范式。
再看下面的图例，同一张图对比，高低立判。
人类画的图，对，但不一定好看。
未经调教的原始模型生成（Nano-Banana-Pro），画出来但难读。
PaperBanana 真正做到了「画清楚、讲明白」，也更符合顶会审美的论文级插图：配色更现代统一，信息更精炼，模块分区更清晰。

那么，它是如何做到这一点的？
PaperBanana「画论文图」变成了一条由多智能体协作完成的流水线。
系统先检索参考范例，再规划结构化描述，并在审美规范约束下生成初稿；
随后由视觉代理将文本描述转化为图像或代码绘图，评论代理不断对照原始论文内容进行纠错与打磨。
经过多轮迭代后，输出的不再是普通示意图，而是一张同时满足语义正确性与顶会审美标准的论文级插图。
这不是简单的作图自动化，而是一种「科研表达方式」的自动规范化。

研究人员还顺带对比了两种路线：直接让模型「画图」VS 让模型「写代码画图」。
结论很扎心：AI 直接画出来的图虽然精美，但经常在数字上胡说八道。
目前最靠谱的方式还是：AI 写绘图代码（基于 Gemini-3-Pro），再生成统计图。

这只是开始。类似工具已经开始出现，比如：Claude Scientific Writer，集成论文写作 + 插图 + 图表生成。
未来科研可能变成这样：你不用再在 PPT 里对齐箭头、调颜色、拖文本框到凌晨三点，而是把更多时间留给真正重要的事情。
https://dwzhu-pku.github.io/PaperBanana/
https://github.com/K-Dense-AI/claude-scientific-writer

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用