Midjourney将推文本转视频模型
Text2Immersion:可通过文本直接生成3D场景
在一些社交媒体截图中,Riot Games艺术家Jon Lam显示了Holz和其他Midjourney开发人员讨论数据库中至少包含4700位独立艺术家作品的消息。据透露,这些艺术家的名字是从Wikipedia和在线交易卡游戏Magic the Gathering中收集而来。此外,软件开发者Brad Templeton的消息警告Holz可能会在使用真实艺术家作品进行训练时面临“版权问题”。
站长之家(ChinaZ.com) 1月4日 消息:微软公司的研究团队最近提出了一种独特且简单的方法,用于生成高质量的文本嵌入。这种新方法仅使用合成数据和极少的训练步骤(少于1,000步),就取得了令人瞩目的成果。相比于现有的方法,该方法不依赖于多阶段的预训练和有限的标记数据微调,避免了繁琐的训练流程和手动收集数据集的问题,这些数据集通常在任务多样性和语言覆盖方面存在问题。
站长之家(ChinaZ.com) 1月3日 消息:阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。