当前位置: 华文世界 > 科技

FancyTech以「垂直模型」引领AIGC商业化落地

2024-08-25科技
在最近的技术变革浪潮中,AIGC(AI生成内容)正成为人们自我表达和创作的重要工具。与传统的大规模模型不同,推动这次革命的是针对特定领域的深度定制解决方案。过去两年间,AIGC的发展速度远超预期,其应用已从文本生成扩展到图像与视频各个方面。
最近,【机器之心】报道了一家名为FancyTech的中国创业公司,该公司通过提供标准化的商业视觉内容生成产品,快速扩张市场,并早于竞争对手证明了垂直模型在实际应用中的优势。
【机器之心】详细介绍了FancyTech最新发布的视频垂直模型DeepVideo,该模型通过解决核心挑战—如何让商品自然融入背景并确保其在视频中运动时不失真—来提高生成质量。
00:20
FancyTech 的垂直模型基于开源的底层算法框架,叠加自有的数据标注重新训练,仅需几百张 GPU 持续训练迭代即可取得好的生成效果。相比之下,「商品数据」和「训练方式」这两个因素对于最终的落地效果更为关键。
FancyTech 在积累海量 3D 训练数据的前提下,引入了空间智能的思路指导模型的 2D 内容生成。在图像内容生成方面,团队提出了「多模态特征器」以确保商品的还原,并通过特殊的数据采集保证商品与背景的自然融合。在视频内容生成方面,团队重新构建了视频生成的底层链路,定向设计框架和进行数据工程,以商品为中心生成视频。
此外,【机器之心】深入探讨了FancyTech如何将「空间智能」的研究思路应用于视觉生成模型的构建。与传统生成模型不同,空间智能通过分析大量传感器数据,进行精确的标定,从而使模型能够感知和理解现实世界。
FancyTech采用激光雷达扫描代替传统的摄影棚拍摄技术,积累了大量的高质量3D数据对,这些数据在模型训练中与2D数据结合使用,以增强模型的现实世界理解能力。
对于视觉内容生成中的光影效果塑造这一挑战性任务,FancyTech在每个环境中部署了可调节亮度和色温的多盏灯,收集尽可能多的自然光影数据,以提高生成图像的空间层次感。
这种高强度的数据收集模拟了真实拍摄场景的灯光,使其更加符合电商场景的特点。结合高质量的 3D 数据积累,FancyTech 在算法框架上进行了一系列创新,将空间算法与图像、视频算法有机结合,让模型更好地理解核心物体与环境的交互。
在AIGC领域内,探索商业化路径的过程中虽有共识亦有分歧。【机器之心】的报道揭示了FancyTech如何通过其「多模态特征器」在多维度上提取商品特征,并利用这些特征生成融合后的场景图,展现了算法的创新和应用的成效。
无论是通用模型还是垂直模型,其终极目标都在于商业化的实现。FancyTech凭借其独有的数据和行业专知,在国内外市场广获认可,与全球多家知名公司建立了合作关系,证明了其垂直模型的商业价值。
FancyTech不仅在核心的垂直模型上取得成功,还提供了AI短视频的全链路自动发布和数据反馈功能,推动产品销量持续增长。
00:52
这一切都表明,AIGC技术正在让普通人通过提升生产力来实现自我创作的梦想,预示着一个全新产业的崛起。