开云体育
开云APP下载DeepSeek新版本悄然上线编程能力大幅提升引发热议
在最近的科技圈动态中,DeepSeek这家小型团队意外地发布了其最新的大模型版本V3-0324,然而这次发布既没有官方新闻稿,也缺乏技术报告,就连在HuggingFace上传的最初文件README也空无一物。尽管如此,由于DeepSeek本身就拥有相当的关注度,这次版本更新还是引发了大量讨论和测评。
从专业人士的反馈来看,V3-0324在编程能力方面表现出色,测评结果显示,在编程能力测试AiderLLM中,该版本在多语言基准测试中的得分攀升至55%,相比之前不足50%的水平有了明显的飞跃,同时超越了OpenAI的o3-mini,接近DeepSeek自家的R1版本。不过,V3-0324仍然稍微逊色于以编程见长的Claude3.7sonnet。
另一位博主Xeophon构建的测试集结果显示,V3-0324在综合能力方面超越了Claude3.5sonnet,目前Only DeepSeekR1、o3-mini以及阿里通义的qwq-32b更加优秀。与此同时,知名的测评平台ChatbotArena也开始将V3-0324纳入测试,尽管具体成绩有待几日后发布,但它的上榜无疑增加了该模型的曝光率。
随着OpenAI在今年推出最新模型GPT-4.5以及推理模型o3的升级,外界对于DeepSeek下一次更新的期望逐渐攀升。路透社报道指出,DeepSeek的下一代推理模型R2可能会比预期的5月更早发布。值得一提的是,DeepSeekR1是基于当前的V3模型进行训练而来,这次V3-0324的亮相或许暗示着R2版本的临近。
DeepSeek这次技术的更新和其随后的一系列开源举措,都在一定程度上撬动了当前AI行业的格局。正如业内认为的那样,开源不仅仅意味着技术壁垒的降低,也加速了中小企业和开发者对技术的利用和创新应用。对于开发者而言,持续的开源行动和技术发布不仅降低了进入AI应用发展的门槛,同时也促进了生态共同进步,值得期待的是,DeepSeek的进一步创新能否解决当前市场中的具体应用场景需求。
总的来说,DeepSeek的最新版本V3-0324的发布的确在编程能力上实现了质的飞跃,而其后续的开源战略与市场布局无疑会进一步影响整个科技行业的未来发展。返回搜狐,查看更多