Manus体验报告

把代码编写交给manus的时候就像是去街上找一个人,对他说你想吃煎饼果子,然后这个人就会去找如何做煎饼果子的教程(搜索网页获取信息),在得到教程后就会去买炉子(开始搭建),然后开始制作(编写代码),最后把煎饼果子给你(可以粗略的理解为面向过程?)而把代码交给例如ChatGPT等其它模型,就像是去便利店买一个煎饼果子,过程是对你隐藏的,直接交付代码,你别管最后好不好吃、吃没吃饱(给的代码有没有解决你的问题),起码是吃上了。
当然,manus做的煎饼果子也不一定会好吃,只是他的解决问题的过程和ChatGPT不一样而已,并不是他的性能真的有多强,他也不是那种真的能够有自己思想的程序员,也无法取代现有的程序员,当然,这个也可能只是时间过程而已。
还有一个影响他做煎饼果子的是获取信息这个过程,因为很多网页需要进行登录才能够获取信息,而manus在搜索的过程中肯定是没有这些账号的,就像是一个学生到了一个没开门的图书馆一样。
当然,以上的问题只是针对“使用manus进行软件开发”这一个方向,就这一问题得出的结果是,manus并没有网上吹的那么好。
他的缺点依然很明显,第一点就是上下文限制,这一点问题在目前现有的所有ai智能体中都存在,就像是一个人拥有有限的记忆,昨天的事情今天就会忘记,写到这里突然就想起一个动画叫“一周的朋友”。当然这个问题还是比较好解决的,就像是电脑存储也是从1KB到现在的几TB、几PB,随着时间都会解决的。
第二点就是上面说的问题,资源获取受限,当然这个问题不止在manus,像KIMI,DeepSeek等ai都会有这种问题。
第三点就是AI幻觉,AI 幻觉指的是 AI 会生成看似合理但实际确实错误的信息,最常见的表现就是会编造一些不存在的事实或者细节。就像是我们在考试的时候,算出的结果是0.9,但选择题的答案是A:1,B:2,C:3一样,这时候就需要靠猜测了,顺着猜测的错误答案当然给出的也就是错误的结果。AI 在遇到信息缺失或不确定的情况时,会基于自己的“经验”(训练数据)进行填补和推理。这不是因为它想要欺骗我们,而是因为它在试图用自己理解的模式来完成这个任务。说到底还是训练数据的局限性,由于 AI 并没有真实世界的体验,它的所有“认知”都来自训练数据。可是训练数据不可能包含世界上所有的信息,有时候甚至还会包含错误信息。还有一点就是过拟合问题,因为大模型的训练参数量非常庞大,大模型会在训练数据上产生“过拟合”的问题。即因为记住了太多错误或者无关紧要的东西,从而让 AI 对训练数据中的噪声过于敏感,最终导致幻觉产生。并且受限于技术原因,虽然现在大模型的上下文窗口越来越大(比如可以处理 64k 或 128k 个 tokens),但它们仍然是在一个有限的范围内理解文本。这就像是隔着一个小窗口看书,看不到整本书的内容,容易产生理解偏差。Manus 是基于通用大语言模型构建的,幻觉发生的概率更大,甚至可能像滚雪球一样越滚越大。目前大量实操案例都表明,Manus 交付的最终成果中往往都存在错误,需要人工进一步筛查。当然,避免AI幻觉也是可以做到的,其中一点就是使用RAG技术,在大家搭建本地DeepSeek的时候都用过一个本地数据库吧,就是在你提问之前,将相关的百科全书交给它,让它来总结答案,就相当于是图书馆没开门,那我们就在家里给他搭建一个图书馆,这样在AI寻找相关答案的时候就会首先去咱们给他搭建的图书馆里查询,就可以很好地避免AI幻觉。

ai-generated-8682027_960_720.jpg

标签

济南豪创网络技术有限公司版权所有     备案号:鲁ICP备2023003983号-1