泥古不化网

生存狂 企业信息管理师(CIO) 注册会计师考试(CPA) 企业级应用 考研政治 土木工程师 仓储/物流 机械维修 写字楼 平面设计

静宁见春

发布时间:2024-09-02 20:28:46

慕江南,视频号品牌直播先行者

围绕Zara这场直播,在业内引发了不少讨论。

评论区有网友提到,现在Midjourney生成的风格更偏向于艺术创作,而不仅仅是简单的还原。一些人甚至开玩笑说,现在不需要出去旅行了,只要付费订阅Midjourney账号就可以了。

LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。

模型下载地址:https://huggingface.co/damo-vilab/dreamtalk