您当前位置: 首页 ·软件教程 · 正文

DeepSeek V4 Lite悄然迭代:2000亿小参数版本性能逼近美国顶流模型

发布时间:2026-03-03 17:07:08

3月3日消息,尽管春节档期间DeepSeek V4并未推出,但DeepSeek于2月11日发布了一款新模型,名为DeepSeek V4 Lite,其参数规模为2000亿,相对较小。

DeepSeek V4 Lite的核心特点在于具备1M的上下文窗口,此前有网友对其进行测试后发现,除了超长上下文这一优势外,其他方面的表现并未带来太多惊喜,毕竟它的参数规模与当前主流大模型相比存在较大差距。

然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区大佬HCPTangHY测试之后也大为震惊,称其有点神,在他的测试中已经是国模SOTA(注:SOTA简单认为是第一就行)。

不仅如此,如果继续训练下去,还有可能开源撬动闭源。

从他的测试来看,DeepSeek V4 Lite的0302升级之后分数比之前的0227版更高一层楼,已经逼近目前最顶流的大模型Sonnet 4.6了。

帖子中还有其他的游戏及前端测试,包括业内很有名的天气卡测试,DeepSeek V4 Lite 0302版不论审美还是功能都是在线的。

回顾这一年来的AI大模型来看,国产大模型在对话聊天方面已经跟闭源模型差别不大,但在多模态、编程、数学及智能体等方面是被甩开的,最近发布的GLM5、MiniMax 2.5、Qwen 3.5系列有所提升,但Anthropic、OpenAI及谷歌也发布了最新的模型,差距又拉开了。

在追赶顶流闭源模型上,国内的公司面临着多方面的不利因素,投入没有美国公司的多,而且算力不够,数据资料方面也不如谷歌、OpenAI,毕竟他们要么有此前多年的积累,要么有大量用户。

而且Anthrpoic之前为了搜集数据,竟然从盗版网站上下载了大量书籍,还被判赔偿15亿美元,由此可见他们在这方面的投入之大,不要脸程度之深。

作为全村的希望,DeepSeek在技术探索领域已然树立起标杆。若2000亿小参数的DeepSeek V4 Lite都能有这般亮眼表现,那么完整版的DeepSeek V4无疑值得高度期待,其发布后想必又会对美国AI产业形成不小的冲击。

精选攻略
查看更多 +
火爆手游榜
  1. 1 异世界厨房超人气现代料理店

    异世界厨房超人气现代料理店

    2026-03-03 17:36:06更新
    查看
  2. 2 NBA2K25直装版

    NBA2K25直装版

    2026-03-03 17:33:07更新
    查看
  3. 3 share旧版

    share旧版

    2026-03-03 17:29:12更新
    查看
  4. 4 实时天气预报王

    实时天气预报王

    2026-03-03 17:28:14更新
    查看
  5. 5 敢达争锋对决官服

    敢达争锋对决官服

    2026-03-03 17:28:13更新
    查看
  6. 6 优桂云

    优桂云

    2026-03-03 17:27:09更新
    查看
  7. 7 语境AI口语

    语境AI口语

    2026-03-03 17:27:09更新
    查看
  8. 8 恐龙模拟进化汉化版

    恐龙模拟进化汉化版

    2026-03-03 17:26:12更新
    查看
  9. 9 枣庄公交

    枣庄公交

    2026-03-03 17:25:15更新
    查看
  10. 10 九重试炼手机版

    九重试炼手机版

    2026-03-03 17:25:15更新
    查看
专题推荐
更多