| AiCoin 实时快讯

ETH

💲2063.66

0.27%

Zhixiong Pan|2026年01月08日 17:57

DeepSeek R1 论文 v2 中文翻译版已更新，摘录几个他们对于之前广泛质疑的首次回应： 1️⃣ 为什么 DeepSeek 回答中出现 OpenAI/ChatGPT? > 对于 DeepSeek‑V3‑Base 的训练数据，我们只使用自然网页与电子书，不刻意加入任何合成数据。但我们观察到部分网页中存在大量由 OpenAI 模型生成的答案，这可能使基座模型在预训练中“间接”获得其他强模型的知识。 2️⃣ DeepSeek R1 之后会关注什么？ > 目前 DeepSeek‑R1 的结构化输出能力仍不如一些现有模型；同时它尚不能利用搜索引擎、计算器等外部工具提升输出质量。但由于为结构化输出与工具使用构建 RL 环境并不困难，我们预计下一版本会解决该问题。 3️⃣ 为什么 DeepSeek 推理中会中英混用？ > DeepSeek‑R1 目前主要针对中文与英文优化；在处理其他语言的查询时可能出现语言混用，例如即便输入是非中非英语言，模型仍可能用英语进行推理并输出。我们计划在后续更新中改进。该问题可能与基座模型 DeepSeek‑V3‑Base 训练数据以中英为主有关。 4️⃣ DeepSeek R1 和 R1-Zero 的训练成本如何？ > DeepSeek‑R1‑Zero 约 $202K；DeepSeek‑R1 约 $82K 还有大量细节：https://randomarea.com/deepseek-r1-v2/(Zhixiong Pan)