VibeVoice - 微软的开源小型文本到语音模型,支持实时流媒体和长篇语音生成,可处理长达90分钟的语音内容,并提供4种不同的声音。
Tripo AI - 将文本或图像转化为可直接用于生产的3D资源
Stable Audio 2.5 - Stability AI为企业级输出推出的全新音频模型
Reve - 免费、高质量的AI图像生成器