译文语言

新课程：构建能生成图像和视频的AI智能体——一个尚待探索的前沿领域

本课程由Andrew Ng与Google Cloud技术团队联合打造，教你构建能生成图像和视频的AI智能体。核心在于让智能体自我评估输出结果并通过迭代提升质量。你将学习三种评估技术：图像-文本相似度评分检测输出与提示的匹配度、基于LLM的裁判按品牌一致性等自定义标准评分、以及结构化评分表将提示拆解为可验证的"是/否"问题（如"主体是否在画面中？""镜头运动是否匹配？"）。课程涵盖图像和视频提示工程、将品牌指南转化为UI原型的图像智能体，以及规划多场景解说并生成同步音频动画的视频智能体。