IT之家 10 月 29 日消息,埃隆・马斯克(Elon Musk)挑战维基百科的新项目“Grokipedia”在公开亮相之初便遭遇“坎坷开局”,维基百科创始人吉米・威尔士(Jimmy Wales)当地时间周二在纽约举行的 CNBC 科技高管理事会峰会(CNBC Technology Executive Council Summit)上表示,“我并不看好他现在能做出什么真正有用的东西。”
![]()
面对马斯克关于维基百科存在“觉醒偏见”(woke bias)的指控,威尔士予以驳斥。“他对这一点完全误解了,”他说,“他对维基的抱怨是,我们依赖主流信源。对此我毫无歉意。我们不会把随机的怪人言论与《新英格兰医学杂志》(The New England Journal of Medicine)相提并论 —— 这并不代表我们‘觉醒’。这很矛盾,我们如此激进,以至于引用了《纽约时报》。”
“我还没时间仔细研究 Grokipedia,应该会挺有意思。但显然里面有很多赞美埃隆・马斯克天才之处的内容。所以我敢肯定,这一定是完全中立的。”他补充道。
尽管威尔士对 Grokipedia(该项目本身已有维基百科词条)进行了讽刺,但这并非出于与马斯克的个人恩怨,而是源于他对所有大型语言模型(LLM)试图打造可信赖在线信息源所做努力的深切担忧。
“他所使用的那些用于撰写内容的大型语言模型,必然会产生大量严重错误,”威尔士指出,“我们清楚地知道,无论是 ChatGPT 还是其他任何 LLM,目前都还不足以胜任撰写维基条目的任务。”
而马斯克显然持相反观点。周二晚间,他在社交媒体发文称:“Grokipedia 将在广度、深度和准确性上超越维基百科数个数量级。”
![]()
威尔士则列举了多个现实案例,说明为何他不相信 LLM 能够以极低的成本复制维基百科全球社区数十年来所建立的成果。他估计,维基媒体基金会每年的硬性技术成本约为 1.75 亿美元(IT之家注:现汇率约合 12.42 亿元人民币),相比之下,大型科技公司持续向 AI 投入数十亿美元资金;据华尔街某机构预测,所谓的“超大规模企业”明年在 AI 领域的总支出预计将达到 5500 亿美元。
其中一个例子涉及威尔士的妻子。他表示,他常以一些冷门话题测试新兴聊天机器人模型的能力。当他询问“我的妻子是谁”时 —— 她虽非名人,但在英国政界有一定知名度 —— 几乎所有模型都会给出“看似合理但实则错误”的答案。威尔士强调:“每当你要求 LLM 深入挖掘信息时,结果往往一团糟。”
他还提到一位德国维基社区成员开发了一个程序,用于验证引用书籍的 ISBN 号码,并成功追踪到多处明显错误的来源。最终发现,此人承认自己使用 ChatGPT 生成文献引用,而该语言模型则“非常愉快地为你编造根本不存在的书籍”。
威尔士表示,无论是来自马斯克的挑战,还是 AI 技术的冲击,这些争议都在提醒维基百科一个严肃的问题:“对我们和整个维基社区而言,最重要的是以加倍坚持中立立场、严格审查信源的方式来回应此类批评。我们不应变成‘觉醒百科’(Wokepedia)。那不是我们应该成为的样子,也不是公众希望看到的。否则将严重损害人们对我们的信任。”
威尔士也坦言,公众和媒体常常给予维基百科过高的评价。他表示,在维基早期,网站的实际质量远没有当时人们调侃得那么糟糕;但如今,“我们也并不像大家想象的那么优秀。当然,我们比过去好得多,但仍有许多工作要做。”
他预计,随着技术发展和虚假信息泛滥,未来的挑战将更加严峻 —— 利用 LLM 制造带有看似可信文本的虚假网站的能力正迅速提升,很可能足以欺骗普通大众。然而,他相信这样的内容很难骗过维基社区。“毕竟我们花了 25 年时间研究和辩论何为可信的信息来源。但它会骗倒很多人,这才是真正的麻烦。”
不过,威尔士也承认,这项“擅长无中生有、产出完全无用内容”的新技术,或许也能为维基百科所用。他正在探索一些有限的应用场景,例如利用生成式 AI 从现有资料中挖掘应被补充进维基条目的额外信息。他认为这类应用目前“还算勉强可用”。
“也许它能帮我们更快完成工作,”他说。如果维基百科能开发并训练属于自己的语言模型,这种反馈机制可能极具价值。但鉴于相关成本高昂,目前网站仍暂缓正式推进此类项目,仅继续进行技术测试。
“我们很欣慰维基已成为世界基础设施的一部分,但这同时也带来了沉重的责任。因此,当人们说我们存在偏见时,我们必须认真对待,并积极改进相关问题。”威尔士说。
但他最后仍忍不住再次调侃:“我们总在谈论 ChatGPT 犯的错误。试想一下,如果有一种 AI 只用推特(Twitter)数据来训练,那会是怎样?那将是一个疯狂、愤怒、被荒谬信息喂养出来的 AI。”





京公网安备 11011402013531号