K線
數據鏈上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
語言
  • 简体中文
  • 繁体中文
  • English
全球行情資料應用程式領跑者,致力於更有效率地提供有價值的資訊。

功能

  • 即時行情
  • 特色功能
  • AI網格

服務

  • 資訊內容
  • 開放數據(API)
  • 機構服務

軟體下載

  • PC版
  • Android版
  • iOS版

聯絡我們

  • 聊天室
  • 商務信箱
  • 官方信箱
  • 官方驗證通道

加入社區

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|舊版
BTCBTC
💲70149.82
-
0.85%
ETHETH
💲2063.14
-
0.71%
SOLSOL
💲86.34
-
1.46%
USDCUSDC
💲0.9999
-
0%
HYPEHYPE
💲37.27
+
2.28%
DOGEDOGE
💲0.09468
+
0.71%

Zhixiong Pan
Zhixiong Pan|2026年01月08日 03:44
时隔一年,DeepSeek 没更新 R2,但低调更新了 R1 的论文(V2),几个重点: 1. 针对 LLM 回答中提及 OpenAI/ChatGPT 的现象,他们给出了解释:是网页数据中客观存在外部生成内容,在被用于基座模型训练的过程中,造成了间接影响。 2. 明确将「结构化输出」与「工具使用」列为未来(R2 ?)演进重点。(这也是构建 Agentic 系统的基石) 3. 新增了「Token 效率」作为明确的未来优化方向,减少对简单问题的过度思考。(GPT-5.1 也提过类似的目标) 4. 在叙事上,DeepSeek 不仅展示了纯强化学习在较少人类干预下的有效性,更试图确立「激励驱动」(Incentive-driven)的学术流派。这一转变传递了明确的行业信号:与其依赖大规模的人类标注,通过正确的激励设计引导模型「自我顿悟」才是通往通用推理的终局。 https://arxiv.org/abs/2501.12948v2(Zhixiong Pan)
+2
曾提及
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

脈絡

01月29日 13:25Binance Wallet 的最新更新
01月26日 23:09Mole更新专注于安全智能清理
01月08日 17:56DeepSeek R1 论文 v2 中文翻译版已更新
01月03日 12:06NFT平台反应速度与用户体验
01月03日 07:50Mac清理工具Mole v1.18.0已上线
12月29日 11:09Binance Wallet扩展全新侧边栏功能
12月25日 10:35Astros推出DCA一键定投工具
12月13日 03:57Mole小鼹鼠发布V1.12版本
12月10日 19:20升级blockstream jade获取功能更新

熱門快訊

|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

APP下載
Windows
Mac

X

Telegram

Facebook

Reddit

複製鏈接

熱門閱讀