DeepSeek是新源神！推理模型o1性能1/50价格，微调蒸馏商用全免费-华威派

> 自媒体 > 手机 > DeepSeek是新源神！推理模型o1性能1/50价格，微调蒸馏商用全免费

DeepSeek是新源神！推理模型o1性能1/50价格，微调蒸馏商用全免费

来源：量子位

2025-01-25

180

管理

梦晨发自凹非寺量子位 | 公众号 QbitAI

DeepSeek新发布远超预期，Reddit/狂暴刷屏中。

同时开放官方API，输入token（命中缓存）价格只有OpenAI o1的1/50，未命中缓存以及输出token价格约1/27。

论文中被反复热议的小细节就更多了：

R1-Zero模型在思考过程中涌现了“顿悟时刻”（aha moment），并自己学会为问题分配更多思考时间。

网友们开始推演接下来的剧情，如果顿悟的力量能被稳定利用……那就不知道会通向何处了。

最后，团队还把在实验过程中很多失败的尝试分享出来，防止后人踩坑。

在过程奖励模型、蒙特卡洛树搜索算法上，DeepSeek都没能获得进展。

不过他们也强调，只是他们失败了，并不意味着这些方法无法开发出有效的推理模型。

未来他们计划在以下方向继续投入研究：提升通用能力、解决语言混杂问题、优化提示词敏感问题，以及改进软件工程任务的性能。

论文地址：https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

参考链接：[1]https://x.com/deepseek_ai/status/1881318130334814301[2]https://www.reddit.com/r/singularity/comments/1i5yvx5/deepseek_discovered_their_new_model_having_an_aha/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

光纤无人机大量使用、乌无人机袭击升级，俄乌无人机战争进入新阶段？

任天堂谈Switch 2可兼容现有Switch游戏：最符合消费者需求的选择

相关文章

骁龙8满血旗舰小米12出现神价格：2699元史无前例

到底怎么选手机才会不被坑，五个配置参数一文看懂

4K60帧葫芦娃看过没顶尖性能级笔记本体验AI

9分钟就能充至满电 210W秒充Redmi Note 12探索版评测

「电脑」最新全球PC市场TOP5 联想惠普份额下跌你用哪家？..

突破传统，引领创新！移动办公新选择，体验华为 MateView专业级显示器..

曝一加迭代旗舰屏幕将从2K回退至1.5K 红米又对了？

王守义十三香给1000多名员工发华为Mate 60：庆祝40周年厂庆..

苹果发布M2芯片，并带来全新MacBook Air 和 MacBook Pro 13 笔记本电脑..

关于作者

黑暗森林(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

7个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索