首页 500强 活动 榜单 商业 科技 领导力 视频 专题 品牌中心
杂志订阅

DeepSeek首次回应“蒸馏OpenAI”质疑

2025-09-18 16:11
文本设置
小号
默认
大号
Plus(0条)
9月18日,DeepSeek再次引发轰动。由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊《Nature》的封面。在论文的补充资料部分,DeepSeek回应了关于DeepSeek-V3-Base训练数据来源的问题。“DeepSeek-V3-Base的训练数据仅来自普通网页和电子书,不包含任何合成数据。在预训练冷却阶段,我们没有故意加入OpenAI生成的合成数据,此阶段使用的所有数据都是通过网页抓取的。”DeepSeek表示。 | 相关阅读(第一财经)
47
Monkey K

Monkey K

不唯上,只唯真

DeepSeek团队在《Nature》封面发表论文,不仅是对外界质疑其蒸馏OpenAI的有力回应,更是技术自信的体现。

DeepSeek团队在论文中大方地展示了其两大核心突破。其一,采用群组相对策略优化技术,是其成本仅为行业零头的原因所在。其二,开创性地验证纯强化学习路径即可显著提升推理能力,模型通过自我验证和反思机制优化输出,因此实现了思考能力更深。而且,该团队敢于将其核心创新在主流科技杂志上透明公开,也暗示DeepSeek最新的技术可能在当前披露的基础上又迭代了,因此没有必要藏着掖着。

另外,除开技术自信,还想聊聊DeepSeek团队“重科研轻资本”的长期主义精神。相较于宇树科技高调IPO,DeepSeek脱胎于一家主营量化私募的公司却不执著于跑步到二级市场圈钱,体现出了罕见的定力。希望未来能有越来越多的国内企业能沉下心来通过持续创新而非资本运作来展现真正的竞争力。

23
张学峰

张学峰

一位不断探索的经济人

AI 技术的训练集成需要原生态数据,不能带有主观的加工合成因素,原汁原味才能创立英雄本色。
AI 操作能力是否要经过数据模拟阶段以形成正确的判断和执行力,值得商榷。考虑到数据来源的多元化和不确定性,如何保证数据的原生态,这是是否能够建立模拟态的关键。模糊计算提高了精确判断的概括性,减少了方向性偏差,“大而全”是一个努力的目标。
对于曲线趋势的拓扑流分析,可以提高预测的精准程度。“趋势”加强了判断的有效需求,通过对空白区域的侵染能力的计算有助于掌握曲线运动的方向、波幅和振频。
我们看好 DeepSeek 的发展前景,他将为使用者带来更多的应用能力。

评论

撰写或查看更多评论

请打开财富Plus APP

前往打开