忧心忡忡网

泰国剧 朝鲜剧 文莱剧 塞浦路斯剧 白俄罗斯剧 卢森堡剧 法国剧 科索沃剧 冈比亚剧 莱索托剧

滴滴崩了的 12 小时,损失千万订单量和超 4 亿成交额,哪些信息值得关注?

发布时间:2024-09-03 23:33:10

“I”:视频输入。GPT-4V对视频的理解还相当原始,因为它将视频视为一系列离散图像。减少信息冗余的最聪明方法是什么?学习目标应该是什么?下一帧预测与下一个单词预测有着明显的类比关系,但它是否是最佳的?如何与语言交错?如何引导机器人和人工智能的视频学习?业界尚未达成共识。

@Meta研究员Martin Signoux

2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。

更多过去一年令你印象深刻的品牌直播案例,欢迎在评论区补充。