(来源:银河基金管理有限公司)


日前,一支来自中国的团队正式对外发布全球第一款通用型AI Agent产品Manus。据其官网介绍,Manus在GAIA基准测试所有三个难度级别上,都取得了最先进SOTA(State-of-the-Art)的成绩。(来源:读特新闻)
银河基金研究团队简评:
此次新品是偏应用层面的创新,主要通过在后台搭建虚拟机占用CPU/内存调取大模型API以实现功能。任务执行本身对算力占用不大,更重要的意义体现在应用落地放量后对推理需求的拉动。该产品可以被看作通用Agent的实现,是工程实践的创新尝试:多个大模型共同协作互相验证+MCP接口协议+容器化/虚拟机+电脑使用的工程化组合实现;在虚拟环境通过AI自动化编程(python),结合本地文件和外部查询执行任务。这一新品一定程度上起到了AI应用认知教育作用,有助于促进其他友商加快大模型Agent领域工程创新方面的投入与进步,加快大模型商业化落地。另一方面,目前主要受限之处在于AI编程能力与多任务序列幻觉问题,任务准确达成率还有待进一步提高。总体而言,对AI应用发展或有所推动。

杭州知名科技企业发布并开源全新推理模型QwQ-32B,参数量为320亿。该研发团队研究了扩展RL的方法,基于Qwen2.5-32B,发现RL训练可以不断提高性能,尤其是在数学和编码任务上;并且RL的持续扩展可以帮助中型模型实现与巨型MoE模型相媲美的性能。(来源:机器之心)
银河基金研究团队简评:
强大基础模型叠加大规模强化学习,有助于逐步提升模型推理效果并降低推理成本,或可推动大模型在应用侧的商业化落地。
混合型