6. Transformer架构的替代方案将得到真正的采用。
此前孟羽童曾透露,自己在格力的工资和应届大学生一样,“基本上在五千到一万块钱这个区间内”。如果按这个说法粗略来算,孟羽童只要在小红书接一个商单,收入就能超过在格力工作2年。
起初,它似乎很有希望。它提供了清晰的架构,选择了正确的框架,甚至将代码整齐地结构化。但兴奋是短暂的,因为它生成的代码不够好,我无法使应用程序启动。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。
体验地址:https://top.aibase.com/tool/m2ugen