滴滴崩了的 12 小时，损失千万订单量和超 4 亿成交额，哪些信息值得关注？

忧心忡忡网

滴滴崩了的 12 小时，损失千万订单量和超 4 亿成交额，哪些信息值得关注？

发布时间：2024-09-03 23:33:10

“I”:视频输入。GPT-4V对视频的理解还相当原始，因为它将视频视为一系列离散图像。减少信息冗余的最聪明方法是什么?学习目标应该是什么?下一帧预测与下一个单词预测有着明显的类比关系，但它是否是最佳的?如何与语言交错?如何引导机器人和人工智能的视频学习?业界尚未达成共识。

@Meta研究员Martin Signoux

2023年，我们看到了扩散模型推理速度方面的一些重大理论改进，例如Song等人的原始一致性模型论文，以及最近的LCM。（另外，对抗扩散蒸馏。）我们已经开始看到使用这些想法的项目，例如Dan Wood的Art Spew(每秒77512×512图像，在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。

更多过去一年令你印象深刻的品牌直播案例，欢迎在评论区补充。