FancyTech以「垂直模型」引领AIGC商业化落地

2024-08-25科技

在最近的技术变革浪潮中，AIGC（AI生成内容）正成为人们自我表达和创作的重要工具。与传统的大规模模型不同，推动这次革命的是针对特定领域的深度定制解决方案。过去两年间，AIGC的发展速度远超预期，其应用已从文本生成扩展到图像与视频各个方面。

最近，【机器之心】报道了一家名为FancyTech的中国创业公司，该公司通过提供标准化的商业视觉内容生成产品，快速扩张市场，并早于竞争对手证明了垂直模型在实际应用中的优势。

【机器之心】详细介绍了FancyTech最新发布的视频垂直模型DeepVideo，该模型通过解决核心挑战—如何让商品自然融入背景并确保其在视频中运动时不失真—来提高生成质量。

00:20

FancyTech 的垂直模型基于开源的底层算法框架，叠加自有的数据标注重新训练，仅需几百张 GPU 持续训练迭代即可取得好的生成效果。相比之下，「商品数据」和「训练方式」这两个因素对于最终的落地效果更为关键。

FancyTech 在积累海量 3D 训练数据的前提下，引入了空间智能的思路指导模型的 2D 内容生成。在图像内容生成方面，团队提出了「多模态特征器」以确保商品的还原，并通过特殊的数据采集保证商品与背景的自然融合。在视频内容生成方面，团队重新构建了视频生成的底层链路，定向设计框架和进行数据工程，以商品为中心生成视频。

此外，【机器之心】深入探讨了FancyTech如何将「空间智能」的研究思路应用于视觉生成模型的构建。与传统生成模型不同，空间智能通过分析大量传感器数据，进行精确的标定，从而使模型能够感知和理解现实世界。

FancyTech采用激光雷达扫描代替传统的摄影棚拍摄技术，积累了大量的高质量3D数据对，这些数据在模型训练中与2D数据结合使用，以增强模型的现实世界理解能力。

对于视觉内容生成中的光影效果塑造这一挑战性任务，FancyTech在每个环境中部署了可调节亮度和色温的多盏灯，收集尽可能多的自然光影数据，以提高生成图像的空间层次感。

这种高强度的数据收集模拟了真实拍摄场景的灯光，使其更加符合电商场景的特点。结合高质量的 3D 数据积累，FancyTech 在算法框架上进行了一系列创新，将空间算法与图像、视频算法有机结合，让模型更好地理解核心物体与环境的交互。

在AIGC领域内，探索商业化路径的过程中虽有共识亦有分歧。【机器之心】的报道揭示了FancyTech如何通过其「多模态特征器」在多维度上提取商品特征，并利用这些特征生成融合后的场景图，展现了算法的创新和应用的成效。

无论是通用模型还是垂直模型，其终极目标都在于商业化的实现。FancyTech凭借其独有的数据和行业专知，在国内外市场广获认可，与全球多家知名公司建立了合作关系，证明了其垂直模型的商业价值。

FancyTech不仅在核心的垂直模型上取得成功，还提供了AI短视频的全链路自动发布和数据反馈功能，推动产品销量持续增长。

00:52

这一切都表明，AIGC技术正在让普通人通过提升生产力来实现自我创作的梦想，预示着一个全新产业的崛起。