开云体育
阿里凌晨重磅开源新模型超强性能震撼科技圈开云体育
在科技迅速发展的今天,各大巨头在人工智能领域的竞争愈演愈烈。3月6日凌晨3点,阿里巴巴再度引发关注,发布并开源了其全新的推理模型——通义千问QwQ-32B。此型号的推出,不仅在技术界引起了热烈讨论,更在股市上掀起了不小的波澜。
通义千问QwQ-32B是一款拥有320亿参数的模型,令人惊叹的是,它的性能竟然可以与大名鼎鼎的DeepSeek-R1媲美,后者的参数高达6710亿(其中370亿被实际激活)。这一性能可谓是高效与精简的完美结合,展示了阿里在模型轻量化方面的巨大进步。
在一系列基准测试中,通义千问QwQ-32B展现出了相当强劲的数学推理、编程能力和通用能力,与OpenAI的o1-mini及DeepSeek的满血版和蒸馏版进行比较,结果显示,千问QwQ-32B在数学能力评测AIME24中,以及评估编程能力的LiveCodeBench中均表现优越,远胜于o1-mini和同尺寸的R1蒸馏模型。
值得注意的是,在由Meta首席科学家杨立昆主导的“最难LLMs评测榜”LiveBench上,千问QwQ-32B同样获得了极高的得分。同时,在谷歌提出的指令遵循能力评测集IFEval和加州大学伯克利分校的BFCL测试中,该模型的得分都超越了DeepSeek-R1,表明其在功能与精准度上的显著提高。
阿里巴巴在发布会中提到,通义千问QwQ-32B的成功得益于强化学习的有效应用,其在大规模预训练的基础上,更加提升了模型的智能层次。此外,阿里团队在推理模型中还集成了与Agent相关的能力,令模型能够在使用工具的同时进行批判性思考,并根据环境的反馈不断调整推理过程,进一步增强了模型的灵活性和实用性。
另外,通义千问QwQ-32B的发布,不仅仅是技术上的突破,也显著降低了部署使用的成本。对于开发者和企业而言,这意味着在普通消费级硬件上也能轻松将这一强大模型部署到本地设备,极大降低了技术门槛。
根据阿里巴巴的资料显示,从2023年年至今,通义团队已经开源了200多款模型,其中包括大语言模型千问Qwen和视觉生成模型万相Wan等多系列,大大丰富了开源模型的生态。值得一提的是,阿里万相大模型在开源仅6天之内,便超越DeepSeek-R1,成功登顶模型热榜和模型空间榜,俨然成为目前全球开源社区最炙手可热的大模型。
最新数据显示,万相2.1的总下载量已超百万,在Github上的Star数已超6k。这一系列令人瞩目的表现,完全展示了阿里在人工智能开源领域的雄心壮志与实力表现。
通义千问QwQ-32B的推出无疑给阿里巴巴注入了新的活力,随即其股价在美股盘后交易中大涨8.61%,报收于141.03美元。而在港股市场,上涨幅度更是超过了7%。据悉,自今年以来,阿里巴巴的股价累计涨幅已接近70%。这一走势无疑是市场对阿里在科技创新及AI领域不断进取的认可。
总结来说,阿里巴巴的通义千问QwQ-32B模型不仅在专业性能上超越了现有的技术框架,还在应用场景和经济成本上提供了更具可行性的解决方案。这样的蜕变足以让我们对未来的智能科技更加期待,也为相关企业的数字化转型指明了方向。返回搜狐,查看更多