一、“AI起号速成班”
AI拥有近乎零门槛的强大文本生成能力,正被无数用户用于互联网的各个角落,制造并散播着海量的“内容垃圾”。互联网这片曾经最美好的创意沃土与数字原野,如今俨然已有变成AI内容垃圾场的趋势。当我们在小红书、B站等内容社区漫游时,那些有着典型AI生成痕迹的诡异视频和笔记,总会在不经意间从算法喂给我们的推荐流中,像驱之不尽的苍蝇般出现,让人产生本能的反感与排斥:
“又一个照抄别人视频,AI批量生产垃圾的克隆号……”
“发布前能不能至少先把那些AI生成的符号删掉?”
与亲力亲为的起号者们相较,还有更让人忧虑的——各式各样的“AI起号速成班”也在泛滥。
![]()
随手一搜就可以检索到一堆用AI进行小红书起号、变现的“运营方法”和售课广告
没有门槛,不需要任何技术基础,不再需要精心构思与创作内容,只要你会用AI并愿意每天轻点几下手指,就能在这场数字狂欢中分一杯羹。
二、一场针对标点符号的“绞杀”
正因如此,一桩耸人听闻的“谋杀”正在悄然发生——“罹难者”是我们最熟悉的标点符号,包括破折号(——)、双引号(“”)、星号(*)、井号()定义标题等。因为这些标准化标记语法与人类的自然写作习惯存在明显差异,所以如果一个文本中出现大量MD常用的标点符号,就极有可能是AI生成的。
![]()
“数字生命卡兹克”推文“AI杀死了破折号,也绞杀了语文”
于是,一些国外的社交网站如Reddit就顺理成章把有没有破折号作为内容是否为AI生成的标准之一。只要出现这个符号,内容就可能被审核系统自动判定为AI撰写。
国内的内容社区如小红书等,也已经开始采用类似的办法,并对相关账号进行流量和权重等方面的处罚。
![]()
国家网信办等发布的《人工智能生成合成内容标识办法》于2025年9月1日正式生效
标点符号如今成了AI生成内容的专属胎记,一旦文本中出现它们的踪迹,就吸血鬼不小心暴露了自己的尖牙一样,人们开始下意识地将其与“AI腔”划等号。
然而如果回溯人类语言文化的发展历程,我们会发现,标点符号系统历经数千年的演变,其间经历过无数现代人难以想象的探索与波折。标点符号的形态与功用有一段随着媒介变化而发展、革命的历史:从古典时代的无间空连写,到中世纪修士为偷懒发明的分段缩进;从印刷术标准化了成对引号的使用,到数字时代直引号因键盘限制而出现,决定标点符号的形态,早已不再是美学与语义需求,而是键盘与编码的物理限制、硬盘与电话的物理形象。
任何符号的命运,最终都由其所处的媒介环境决定。符号滞后于媒介与技术变化,但每个全新标点功用与形态的曲折发展与确立过程,都可谓是人类文明追求表达精准化、规范化的智慧结晶。借用本雅明“发达资本主义时代”的隐喻,随着晚近“发达数字时代”的到来,一场静默的文本革命再次发生——写作的核心需求正从“所见即所得”的视觉排版,转向“所想即所构”的结构输入。数字时代引发的,是人类处理文本信息的最根本逻辑转换。
三、Word和Wps的致命伤:样式
源自中世纪的Word段落标记“¶”在默认状态下,这个符号会被隐藏,需要选中“显示非打印字符”或“显示段落标记”后才可以被看到。这个符号其实回车,俗名“硬回车”,本质上是段落分隔符——一个虽然看不见却实际存在的“非打印符号”。
与“硬回车”相对的是“软回车”,就是上文提及的换行,又称“手动换行符”。在微信聊天窗口等编辑器中我们会经常使用到它,输入方式一般是Shift+Enter或Alt+Enter。其实某种意义上,两者最核心的差异是下行是继承还是重置上行的“样式”(Style)。
“样式”,一个困扰着无数文档工作者的永恒难题。
想象这样的场景:你的论文在自己电脑上显示完美,但在导师的电脑上却面目全非。究其原因,往往是因为作者没有正确使用样式,而是自己手动调整了特定文本的外观,这种“表面像”但“骨子里不对”的调整方式,一旦换一台设备,原来“正确”显示的格式就无法复现了。类似的例子不胜枚举,我们之中不知得有多少可怜虫恐怕都有过明明论文内容无可指摘,却屡屡被boss打回要求重写,只是因为格式怎么调都调不对的经历。
![]()
图片引自设计自媒体“the type”
这种困境不仅存在于学术写作中,在自媒体文案、商务文档、技术报告等各种需要严谨排版的场景中都屡见不鲜。比如对于图文自媒体运营者来说,“样式套嵌”往往是最让他们头大的难题。
想在微信公号上套用一个喜欢的样式,把文本粘贴过来,样式却怎么粘都粘不对;想多平台发布同一篇图文,不同平台编辑器的样式标准不一样,每次发布都得从头再做一次“排版设计”。
在专业排版乃至对结构要求较高的文档中,如果不能正确辨别与熟练使用这些特殊的符号,文本的结构与可读性更是将受到致命影响。
四、“发达数字时代”的文本特质:内容与样式分离
其实,诸如Word、Wps、微信公众号后台等编辑器均为富文本编辑器(Rich Text Editor,简称RTE)。RTE的指令明晰直观,操作简单易用,只要在界面栏简单地点击几个按钮,就可以给选定文本渲染出调整后的样式,并且这种样式效果可以即时展现在界面上,有着“所见即所得”(What You See Is What You Get,简称WYSIWYG)的特点。
在“所见即所得”(WYSIWYG)技术成熟前,文本在编辑器中出现时使用的是系统强制的统一的字体和样式,几乎没有布局(边距、间距等)选项可供用户操控。
但“所见即所得”的缺点在这个时代已经被无限放大:渲染出的样式不具有标准和通用性。
其实,图像与排版的底层逻辑已经发生了根本性的改变,信息的视觉呈现效果样式主要是由精确的代码控制。
所谓前端(Front-End),是指用户在屏幕上直接看到和可交互的网页或应用程序界面,它是连接用户与后端(服务器、数据库)的可视化层,由HTML+CSS+Javascript三大核心技术构成,JS主要与人机交互控制有关,而 HTML和CSS的关系就正好体现了“发达数字时代”文档内容与样式的“分离”本质。
作为轻量级标记语言(Lightweight Markup Language,简称LML)的一种,HTML的主要作用是用标签符号定文本结构,而CSS则是用选择器定位HTML对应的标签,并赋予其统一的样式属性,页面的样式与布局受到CSS的控制。
CSS是文本内容与视觉效果的标准中间件,无论是什么前端页面,什么视效标准,只要CSS代码确定,视觉效果再同一个系统内就具有确定性。
CSS确定样式,HTML确定文本结构,它们共同承载了以往标点符号的功能。由于样式的可套用性,相较信息输入(文本编辑)的视觉呈现效果来说,文本的结构化需求重要性已愈发凸显。
五、数十分钟即可上手的Markdown语法
相较HTML这种源码相对复杂、语法复杂度相对较高、主要用于网页开发的LML(Label Markup Language,标签标记语言)来说,MD作为一种语法复杂度极低、能给完成基础排版与文档结构化任务的LML,已经得到广泛的推崇与应用。
![]()
MD基本语法极为简单易学,最多数十分钟即可上手,最多不过数天即可熟练掌握。
MD的核心思想就是为了让作者能够专注撰写内容,而不用分心于繁琐且容易出现各式各样问题的格式排版。这样,无论同样文档在不同平台发布,还是不同终端之间文档格式的视觉效果,还是一个大型项目中不同主创人员不同文档格式如何统一等等,都将不再成为问题。维基百科的后台编辑器是LML的,维基百科注重的是内容,样式有了对不同字段的规定后保证统一即可,具体到每一个志愿者和每一个百科条目,内容的易编辑、易阅读才是首要需要达成的目标。时下热门的各类文本编辑器与笔记软件更几乎无一不支持MD格式,比如大名鼎鼎的Typora、Vscode、Obsidian等等。
这也是AI生成的文本普遍采用MD格式的主因:几乎所有平台和第三方API调用程序都支持渲染MD,不会出现样式问题。
随着文本编辑核心是结构化写作而非视觉排版的数字时代的发展,LML必然逐步取代RTE,成为主流的文档信息处理模式。
如果说在媒介主要是碑铭、简帛、抄本的前印刷术时代,标点符号主要是听觉主导的句读标记;而我们对标点符号最熟悉的认知,则是它们在印刷与纸张时代的主要功能——视觉主导的排版工具;那么在现在的“发达数字”与 AI时代,文本数据结构的逻辑标记才是它们最重要的身份。
任何技术的发展总会带来巨大的人群分野。一方面,程序员、学术工作者和数字原住民们正在全面拥抱MD。在高校实验室里,研究生们用.md格式撰写论文初稿;技术博主们用简单的标记语法维护着个人知识库,最新一代的写作软件都不约而同地将MD作为默认编辑模式——连MD格式都不支持?那应用就等着被市场淘汰吧。
但另一方面,在更广阔的大众视野中,这个变革几乎毫无波澜。菜市场的小店主仍在使用手机备忘录里的富文本编辑功能,各种办公室的普通文员还在与Word的样式窗格搏斗,很多社交媒体上的内容创作者们甚至不知道平台后台其实支持MD格式的渲染。
所以在他们看来,一段使用MD语法的内容,简直就和一段没有错别字的文本一样,是很不“正常”的。
六、内容的“柠檬市场”:劣币驱逐良币的逆淘汰
语言文字作为人类交流的基础工具,其本质在于信息的有效传递而非形式规范。在香农的信息论意义上,说话人发出语音信号,听话人接受语音信号,言语是在两者间沟通的信道中传输的信息。
![]()
言语链示意图,图源陈保亚《语言学概论》
言语绝不是说话人把音素、单词、短语、句子按照一套理想的语法规则一层一层套嵌生成的严谨语流。只要达成交际的功能,把信息无误地传递给对方,言语的任务就完成了。所以语言文字本身的严谨性、规范性在人们的日常表达、交流中并不重要。
根据米勒定律,人类阅读文本、理解语言,总是以7±2个信息单元为一个组块整体理解信息的。个别的字词错误、颠倒完全不影响人们理解,甚至人们根本不会发现。这种现象绝非是因为什么所谓的中文是“象形文字”,信息密度高导致的。但学习了海量语料的AI生成的“回答”则不同。机器的文本是了解语法、按照概率生成的,所以一定不会像人类一样产生错别字。
![]()
AI生成内容鉴定的“错别字判定法”
而破折号与引号根本不是一般MD格式文档中的常用符号,但在AI生成的文本中,它们出现的频率极高。这主要是因为AI对复杂句型(如嵌套从句)处理不如人类灵活,破折号等符号可以明晰句法结构,并使AI生成语句的语句有更好的层次感。
实际上,它们的功能与人类在书面语的用法并无不同。这些书面语精确表达的基石本就是用于准确传达语言的层次与边界的。但为了让自己生产的内容看起来不像AI写的,很多用户开始故意用错“得地的”、故意写错别字、故意不用在书面语中语用并无差别的标点符号……如今的内容创作领域正上演着一场荒诞的生存游戏——创作者们不得不战战兢兢地自我审查,只是为了证明:我真的是个人。即使规范的“的地得”、更严谨的写作习惯与表达、更方便的标记性MD语言本来就是他们的写作习惯。
![]()
在使用MD写作的社交媒体账号上,经常可以看到类似的指责。用户的表面理由是文中有MD符号,但实际原因却是因为他不喜欢或不喜欢创作者的观点,所以用“AI生成内容”的理由攻击自己反对的观点,甚至直接举报创作者。
这场闹剧与经济学上会导致二手市场最终必然失灵的“柠檬市场原理”有着惊人的相似性。在二手交易中,卖家比买家更了解商品真实状况,而买家难以完全辨别质量优劣,因此会产生如下臭名昭著恶性循环。面对标价不同的二手商品,买家无法判断标价高的和标价低的商品之间到底有什么区别,所以他只能根据他看到商品的“平均价格”出价,即使标价高的品质的确是更好的。
在这场逆向选择中,优质卖家无法接受“平均价格”,所以退出市场,而劣质卖家乐于成交,又进一步拉低了“平均价格”。买家看到“平均价格”降低,就进一步压低报价,从而逼走优质商品和卖家。久而久之,买卖双方之间的信任将彻底瓦解,市场一步步萎缩,直至最终崩溃。
乔治·阿克洛夫因为这个“绝望”的发现而获得诺贝尔经济学奖。这个因不信任而终将导致自我毁灭的市场预言,如今正在数字内容领域精准复现。二手市场因信息不对称而劣币驱逐良币,内容市场也正在经历一场可怕的逆淘汰——为了躲避AI嫌疑,人们主动放弃精确表达,致使文字世界滑向粗鄙化的深渊。
就像“数字生命卡兹克”锐评的:为了证明自己是人,我们可能要先放弃一部分过去被认为是文化和体面的东西。这就像一场反向的进化。我们正在被AI逼着走向一种表达上的降级。AI正在绞杀语文,而我们,正在通过拥抱反智,来证明自己的清白。创作者被迫让自己的文字看上去不完美,他们主动降低自己的文化素养,就像先往自己身上抹泥巴,来以骗取读者(“用户”可能是更恰当的称呼)以及平台算法的信任。
标点符号本是书面语精确表达的基石,人类语文教养的构成基质。而现在这场关于标点符号的“谋杀”运动,本质上是对人类数千年语言文明成果的无意识自我消解。当我们将那些凝结着文明智慧的精致符号简单等同于“机器特征”时,恰恰构成了一场文明自戕式的逆向退化。
我们或许更该反思的是:
这是AI的表述存在的“缺陷”,还是人类自己正在大范围遗失追求严谨、规范、卓越的能力?我们自己还有做出语言严谨、精确的日常表达的能力吗?
在这场内容市场的自杀式“柠檬化”进程中,最终被驱逐的可能不是AI,而是人类曾经引以为豪的语文教养与文化素质。
董牧航





京公网安备 11011402013531号