建投传媒互联网

发布时间 :2023-12-07 09:52:30
AI+视频/多模态,进展超预期【建投传媒互联网】

1、Pika1.0超预期
首个正式测评,Pika的语义理解、视频连贯性、质量效果表现均亮眼。

我们认为视频模型迎拐点,是语言模型之后,新的AI底层能力
最新论文,大型视觉模型(LVM)可以完全不依赖文本语言数据,只需看图训练。

2、谷歌发布多模态模型
Gemini模型能听、能说、能看,可以中文交互,视觉理解环境,支持文本/图像/语音/视频/代码。

👉相关公司
1)产品:#易点天下(KreadoAI)、盛天网络(给麦)、焦点科技、万兴科技

2)数据:据Pika创始人,高质量的视频模型,训练数据要具备高像素+高审美/艺术构图+一定长度的视频
#华策、捷成、视觉中国

3)其他:掌趣科技(AI+UGC)、巨人网络(AI推理游戏)、世纪天鸿、汤姆猫财商新星##财经#

热门评论

今日热门