有感“精神的乳汁”(3)

标签:
杂谈 |
分类: 雜感 |
有感“精神的乳汁”(3)
短视频“一眼过”,很可能难细看,电脑手机“提笔忘字”实属忐忑无赖。
视觉的智能——我称之为空间智能——更为根本。语言很重要,但作为人类,我们理解和与世界互动的能力在很大程度上基于我们所看到的。(李飞飞)
AI领域的下一个前沿技术方向——空间智能是机器在3D空间和时间中感知、推理和行动的能力。
OpenAI的Sora模型可以文生视频,但就本质而言,它仍属平面二维模型,没有三维立体理解能力,只有通过空间智能,才能看到世界、感知世界、理解世界并让机器人做事,从而形成良性闭环。空间智能公司World Labs的目标是开发一种能够理解实体世界的模型。
让计算机具有人类的空间智能,它们需要能够建模世界、推理事物和地点,并在时间和3D空间中进行互动。简而言之,我们需要从大型语言模型转向大型世界模型。
专家指出,视觉空间智能在现实世界中的应用,比以往任何时候都更近了。比如AI眼镜,它可以向我们显示去过的地方,还能定位、导航。(2025-1-27老邓)