(资料图片)
Meta 发布新模型SAM。Meta 于近日发布图像分割基础模型SAM(SegmentAnything Model)。SAM 模型能够在未经过同类数据训练的情况下,自动分割图像中的所有内容,自动根据提示词进行图像分割。在发布SAM 的同时,Meta 开源了目前最大的图像分割数据集SA-1B,为同类其他模型的研究打下了坚实的基础。
图像识别行业的“GPT-3”时刻。图像识别与分割是当前许多智能化场景的基础。例如智能驾驶中就需要对摄像头呈现出的图像进行分割与识别,从而让车辆做出反应。医学影像诊断中需要对病变位置进行分割来进行判断。过去,图像分割往往只能通过对预先打包的数据进行训练,并针对海量的特定场景进行调优,效率和成本均不占优。此次Meta 发布的SAM 模型,能使得AI 通过已有数据的训练,获得面对未知内容的自动识别能力。我们认为,可以把这个过程比作人类的视觉,人类所拥有看见新事物时自动处理并理解的能力。这将改变传统的图像识别训练模式,加快图像识别行业的发展。
视觉大模型,算力要先行。相较于传统的图像识别解决方案,SAM 更加偏向于LLM 模型的模式,即通过海量的预先训练与扩大模型参数,来使得模型获得自主识别和学习能力,最终实现图像“AGI”。这类模式对于算力基础设施的需求程度远大于传统的小模型或者垂直模型,同时图像模型包含的数据量更大,训练过程中需要的计算能力,通信能力和存储能力相较于文字模型更多。因此,视觉大模型的前提是海量的算力基建,算力的重要性在LLM 模式迈入图像领域时被再度提升。
硬件平台+边缘算力,SAM 模型带来的新边际变化。SAM 模型带来的泛化识别能力与通用性能力,除了改变已有的自动驾驶,医学影像等传统图像识别领域的发展路径外,大大拓宽了图像识别领域在日常生活,商业生产中的应用场景。我们认为,相较于文字,图像的获取更加依赖如摄影器材,监控设备等硬件平台,因此在图像LLM 领域,软硬结合的公司将会有更好的先发优势。通过已有的图像获取硬件搭建具有图像大语言识别功能的平台,将会是SAM 模型渗透进入日常生活的路径。同时,对图像进行预处理的边缘算力重要性也将提升,通过边缘算力对产生的图像进行实时识别或预处理,将会成为SAM 模型发挥作用的关键一环。
投资建议:SAM 模型将带来算力新一轮升级浪潮,首推算力侧核心标的。
光通信:新易盛、天孚通信、中际旭创、太辰光、德科立、华工科技。
边缘算力:美格智能、移远通信、广和通。
图像识别:中兴通讯、创维数字。
风险提示:算力发展不及预期,SAM 迭代不及预期。
关键词: