Midjourney将推文本转视频模型
这是一款基于微信AI能力的微信小程序,可以实现图片选定区域的消除修复功能,纯客户端实现,无需服务端支持。用户友好的方法使得照片修复易于访问,QR码提供快速入口。
🚀 风格预测功能: 具备说话风格预测,根据语音自动调整动画表情,使得生成的动画更加贴近原始音频。
结语
LLaVA在视觉聊天和推理问答方面表现出接近GPT-4水平的能力。在视觉聊天方面,LLaVA的表现相对于GPT-4的评分达到了85%,在推理问答方面更是达到了92.53%的超过GPT-4的新SoTA。LLaVA在回答问题时,能够全面而有逻辑地生成回答,并且可以以JSON格式输出。