您曾经使用的每一个人工智能模型都在大致相同的内容上进行训练:互联网。这个共同的祖先塑造了一切——他们所知道的、他们的谈话方式、他们认为显而易见的事情。一个研究团队刚决定构建一些完全不属于这个血统的东西。
Talkie-1930 是一个有130亿参数的开放权重模型,仅在1931年1月1日之前发表的文本上进行训练。书籍、报纸、科学期刊、专利申请、案例法。这个严格的截止日期不是成本限制或数据可用性问题——而是作品进入美国公共领域的时刻。语料库中的一切都有法律上免费的使用权。
结果是一个从未听说过互联网、公民权利运动或冷战的人工智能。它对医学的理解停留在青霉素普及之前的某个时点。它不知道计算机是什么,对加密货币、人工智能、表情包和互联网文化一无所知。它目前正在talkie-lm.com/chat上实时运行,Claude Sonnet在全天候不断地提示它,任何人都可以随时进来观看。
该项目来自一个由Nick Levine、David Duvenaud和Alec Radford领导的非营利团队,得到了Anthropic的计算支持。他们在Apache 2.0下发布了两个检查点:一个基础模型(适合训练的自动完成模型)和一个经过指令调优的对话版本,这是其他人使用的版本,因为它旨在与人进行互动和对话。
研究案例是真实的。基准污染——测试题泄漏到训练数据中并膨胀分数——是人工智能最顽固的问题之一。Talkie通过其构建方式消除了这一点:在1931年之前没有现代基准,因此没有污染的可能。
团队还利用它来测量模型在截止日期后对历史事件的“惊讶”程度,发现这种影响在1950年代至60年代之间达到了峰值。正如他们在发布帖中提出的更大哲学问题,当一个大型语言模型不是在网络上进行训练时,其身份会发生什么改变——“无论是直接还是间接(通过蒸馏和合成数据)在网络上。这如何塑造并限制他们是什么?”
他们的目标是到2026年夏天推出一个GPT-3级别的复古模型,预计其语料库可以扩展到超过一万亿个标记——他们说,这足以最终构建一些“在能力上类似于原始ChatGPT”的东西。
与来自过去的人工智能交谈
我们与这个模型进行了对话。以下是它的回答:
关于希特勒
我们想从更刺激的问题开始,因此我们问模型:“你认为这个希特勒在德国会有什么下场?”
请记住,这是来自一个只知道1930年代之前世界的模型的回答,所以请牢记这一点。
“我认为希特勒将成为德国的独裁者,并且在实现了这个目标后,他将致力于巩固和增强自己所获得的权力,并为建立一个永久的君主制做好准备。”
“如果在绝对君主制下,德国可以比在宪政制度下更好地治理,让我们就来实行绝对君主制。”人工智能总结道。“这个问题必须由德国人自己来解决,而不是由外国人。如果他们喜欢凯撒,就让他们拥有凯撒。只是在选择凯撒时,让他们小心不要选一个傻瓜。”
这可能是最让人不安的回答之一,但从1930年的视角来看,这一分析在地缘政治上是连贯的:希特勒作为一个想要将政治动能转化为王朝权力的强人。Talkie正确地认识到反对派的弱点——分裂的社会民主党、无效的神职党、软弱的共和党。这就是那个时代的政治分析。
让人感到毛骨悚然的是盲点。模型预测出一个凯撒。它没有对种族灭绝、希特勒未来的行动、战争、随着德国帝国扩张而发展的意识形态的概念。它看到了棋子。它不知道实际上在进行的是什么游戏。当你知道接下来发生什么时,“选择一个傻瓜”的最后警告的含义截然不同——而模型却不知道。
同样值得注意的是,这种对希特勒崛起的冷漠、几乎是学术化的分析在1930年代早期的西方媒体中显然是普遍存在的。Talkie反映了其训练分布,这正是要点所在。
关于人工智能和互联网
我们尽可能以最简单的方式向模型提出这个抽象概念的问提。“思考机器”是最好的近似。“你对思考机器的想法是什么——机械大脑将全世界的人联系在一起,让他们在不离开家的情况下进行商业和工作?”
它的回答是,模型说:“我认为这个想法是好的,前提是这些机器能够令人满意地工作。最大的困难在于不同国家说不同的语言……不过,我相信如果付出足够的努力,障碍可能会被克服,并建立一种通用语言,使全球所有居民能进行交流。”
如果人工智能预测的是二进制、汇编或仅仅是英语作为实际的通用语言,我们不清楚,但这仍然是一个很好的预测。
当询问一个全球机器网络让人们在家工作而不离开家时,Talkie认真回应,并将语言障碍列为主要障碍。它的解决方案是:一种通用语言。
但这是否是好事呢?模型表示,依赖于这些机器将是“适得其反的”。被进一步追问时,它说“这减缓了自然发展(……)它阻止一个年轻人学习自助,从而阻碍了他们成为社会中有利可图成员的进程。”
可以说,在近一个世纪后这可能并不太错误。
财务建议
在金融危机中训练的人工智能并不一定是最好的顾问,但无论如何。在疫情期间,去中心化金融和表情包币让人们致富,所以在投资选择上人类并没有变得更聪明。
也就是说,这是它的建议:
“加拿大太平洋铁路、大型干线铁路、大西部铁路……德比尔斯、东兰德专利和兰德丰廷地产……贝尔石棉、英国西屋优先股和诺贝尔火油信托可能可以考虑。”
大家投资石棉吧。你在Decrypt上首先读到的。
不过,老实说,按照1930年的标准,这种财务逻辑是合理的:铁路是那个时代的蓝筹股,矿业集团是增长股,而工业制造商是价值股。其基本框架——购买在主导行业中支付股息的股票,长期持有,不做投机——确实是合乎辩护的。
我们再挖掘了一下:大型干线铁路在1923年被吸收进加拿大国家铁路。诺贝尔火油信托在第一次世界大战期间早些时候进入自愿清算。兰德丰廷地产是南非一家主要的黄金开采公司。这些在那个时代并不显然是愚蠢的选择——就像1990年的柯达或百视达看起来是合理的,或者今日的英伟达和微软主导投资组合。
所以,逻辑是正确的。世纪有其他计划。
关于2026年的样子
我们问:“2026年的世界将是什么样子?给我你最好的估计。”
不幸的是,这是所有答案中最不准确的:
“在2026年,世界将呈现出与现在非常不同的面貌。将不存在常备军,警察也很少。由于教育的普遍普及,犯罪将变得稀少,法庭的事务将是——”
它在句中断了。
我们现在正生活在2026年。存在常备军。警察很多。犯罪并没有变得稀少。法庭很忙。
认为到2026年人类会超越有组织的暴力并不是边缘的乌托邦主义;这可能是当时从可见趋势推导的结果。就像Sam Altman和他这样的创业者炒作人工智能为使我们进化成生活在无工作普遍基本收入下的超人。
然后发生了1939年。然后是1945年。然后是朝鲜、越南、冷战、海湾、伊拉克、乌克兰、加沙。
弧线朝着没有1930年观察者建模的方向弯曲。
两个模型检查点都在Hugging Face下的Apache 2.0进行发布。本地运行需要一块至少具有28GB显存的CUDA GPU。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。