碾压GPT4!DeepSeek V3.1 用1/10 成本实现128K超长文

作者:梅雅鑫 责任编辑:包建羽 2025.08.21 16:27 来源:通信世界网

通信世界网消息(CWW)8月21日,DeepSeek在其官方公众号上正式宣布DeepSeek-V3.1发布。这一消息瞬间在AI领域掀起波澜,究竟这次升级带来了哪些变化?让我们一探究竟!

官方表示,本次升级包含以下主要变化:

混合推理架构:一个模型同时支持思考模式与非思考模式;

更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;

更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

三大升级:更快、更高、更强

当前,AI要么答得快没深度、要么分析细等半天。DeepSeek-V3.1 创新性地引入混合推理架构,实现了一个模型同时支持思考模式与非思考模式的重大突破。这意味着什么呢?

简单来说,用户在使用过程中,能够根据实际需求,通过 “深度思考” 按钮,自由穿梭于两种模式之间。当你需要快速获取信息时,非思考模式可以迅速给出结果;而遇到复杂问题需要深入分析时,思考模式便能大显身手,为你抽丝剥茧,提供更具深度和逻辑性的答案。

而且,与 DeepSeek-R1-0528 相比,DeepSeek-V3.1-Think 在思考效率上实现了质的飞跃。面对同样复杂的问题,它能够在更短的时间内给出答案。想象一下,以往可能需要等待数秒甚至数十秒才能得到的分析结果,现在转瞬之间便呈现在眼前,大大提升了用户的使用体验和工作效率。无论是学术研究中的资料分析,还是商业决策中的数据解读,DeepSeek-V3.1-Think 都能成为你的得力助手,让思维的速度跟上你前进的步伐。

测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。

image.png

在各项评测指标得分基本持平的情况下(AIME 2025: 87.5/88.4, GPQA: 81/80.1, liveCodeBench: 73.3/74.8),R1-0528 与 V3.1-Think 的 token 消耗量对比图

AI做复杂任务不靠谱?通过 Post-Training 优化,DeepSeek-V3.1 在工具使用与智能体任务中的表现有了显著提升。新模型在面对各种复杂的智能体任务时,能够更加灵活、高效地运用工具,完成任务的质量和准确性都有了大幅提高。

在智能办公场景中,它可以更好地协同各类办公软件,自动完成文档整理、数据分析等繁琐任务;在智能客服领域,能够更精准地理解用户需求,提供更贴心、高效的服务。

官方平台+API同步焕新价格有变化!

随着DeepSeek-V3.1的发布,官方App与网页端模型已同步完成升级。用户无需复杂操作,即可在熟悉的平台上体验全新版本带来的强大功能。

同时,DeepSeek API也迎来了全面升级。其中,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展至128K,这使得模型在处理长文本和复杂对话时更加得心应手。

DeepSeek-V3.1的发布,无疑为AI领域注入了新的活力。其在模型性能、功能模式以及API服务等多方面的升级,为用户和开发者带来了更多的便利和可能性。

最后划重点!DeepSeek官宣:北京时间2025年9月6日凌晨起,API调用价格要调整!不仅要执行新版价格表,夜间时段优惠也没了!但好消息是,9月6日前还按原价算,想省成本的开发者、企业,这段时间赶紧冲,错过可就没这低价了,记得提前规划好用量!

image.png

即将到来的API价格调整,将促使行业各方重新审视成本与效益的关系。在这个快速发展的AI时代,DeepSeek能否凭借此次升级在激烈的市场竞争中脱颖而出?让我们拭目以待!

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容