Face-Adapter是一款高效的人脸编辑适配器,支持预训练扩散模型,提供细粒度的身份和属性控制,适用于个人创作、影视制作和研究应用。
PuLID是一款基于对比对齐技术的图像生成工具,支持个性化定制,适用于艺术创作、广告设计和游戏开发等多个领域。
ModelScope 是一个集成先进机器学习模型的平台,提供模型探索、推理、训练、部署等一站式服务,助力用户实现创新与实践。
腾讯音乐·启明星为音乐创作者提供一站式音乐制作和宣传推广服务,让好音乐不再埋没。
Tora Tora是一款基于轨迹导向扩散变换器技术的视频生成工具,能够快速生成高质量、富有创意的视频内容,适用于个人创作者和企业市场营销。
UniVG是一种统一模态视频生成系统,支持处理任意组合的文本和图像输入条件,具有多条件交叉注意力和偏置高斯噪声技术,适用于视频内容创作、视频编辑工具和虚拟现实应用场景。
Aiuni是一款AI生成独特资产的工具,包括头像、动画和3D模型等,帮助用户轻松实现创意表达。
HoloDreamer是一款基于文本描述生成全景式3D场景的框架,能够从复杂的文本描述中生成风格化、高质量的全景图,并通过3D高斯点云重建实现了视角一致性和完整性的3D场景生成。
MusiConGen是一款基于Transformer的文本生成音乐模型,支持节奏和和弦控制,多样化风格选择,适用于音乐创作、广告配乐和游戏音乐等场景。
沃恩智慧专注于为大学生、硕士、博士提供专业的学术辅导服务,涵盖SCI论文写作、EI论文辅导、升学规划等,帮助学员实现理想的学术目标。
Idea-2-3D是一款基于协作式LMM代理的3D模型生成工具,能够从交错的多模态输入中生成3D模型,支持自动化的3D模型设计和生成,提供了更好视觉质量的图像生成功能。
FunAudioLLM 是一款集成了高精度语音识别和自然语音生成的前沿技术框架,旨在提升人类与大型语言模型之间的自然语音互动。