AI 正大步迈入 数字内容生产领域,不仅在写作、绘画、作曲等多个领域达到“类人”表现,更展示出在大数 据学习基础上的非凡创意潜能
AIGC 正在越来越多地参与数字内容的创意性生成工作,以人机协同的方式释放价值,成为未来互联网的内容生产基础设施
从范围上看,AIGC 逐步深度融入到文字、音乐、图片、视频、3D 多种媒介形态的生产中, 可以担任新闻、论文、小说写手,音乐作曲和编曲者,多样化风格的画手,长短视频的剪辑者 和后期处理工程师,3D 建模师等多样化的助手角色,在人类的指导下完成指定主题内容的创作、编辑和风格迁移
从效果上看,AIGC 在基于自然语言的文本、语音和图片生成领域初步令人满意,特别是知识 类中短文,插画等高度风格化的图片创作,创作效果可以与有中级经验的创作者相匹敌;在 视频和 3D 等媒介复杂度高的领域处于探索阶段,但成长很快。尽管 AIGC 对极端案例的处理、
细节把控、成品准确率等方面仍有许多进步空间,但蕴含的潜力令人期待
从方式上看, AIGC 的多模态加工是热点。吴恩达(Andrew Ng)认为多模态是 2021 年 AI 的 最重要趋势,AI 模型在发现文本与图像间关系中取得了进步,如 OPEN AI 的 CLIP 能匹配图像 和文本,Dall · E 生成与输入文本对应的图像;DeepMind 的 Perceiver IO 可以对文本、图像、 视频和点云进行分类。典型应用包括如文本转换语音、文本生成图片,广义来看 AI 翻译、图
片风格化也可以看作是两个不同“模态”间的映射。