最近我一直在学习ai生成图片和创作,所以对ai工具就比较关注
一般我经常使用的几个主流ai
生成文本:Kimi、通义千问、ChatGPT、DeepSeek
生成视频:即梦
我们先用这几个ai生成图片描述词或视频描述词,然后再用即梦ai来生成图片或视频,然后用讯飞听见来识别音频中的语音生成字幕,或者用讯飞智作来生成音频或字幕,即梦中的数字人模块中也可以输入文本生成音频
以下这几个是我正在关注的ai模型,虽然我没有用过,但是我大概了解了一下
FLUX.1 Kontext 是一款由 Black Forest Labs 开发的先进图像编辑模型,支持生成与编辑图像,具有强大的上下文理解能力。
生成与编辑图像:FLUX.1 Kontext 不仅支持文本生成图像,还能根据上下文进行图像编辑,允许用户同时使用文本和图像作为提示词,生成协调一致的画面。
角色一致性:该模型能够在多个场景中保持角色的一致性,确保图像中的独特元素(如角色或物体)在不同环境中保持相同的特征。
风格参考:用户可以根据文本提示生成新颖场景,同时保留参考图像中的独特风格,适用于故事板生成和渐进式叙事创作等场景。
精确编辑:FLUX.1 Kontext 允许用户通过自然语言命令对图像进行精确的修改,例如更改颜色、替换对象或修改文本,保持其他部分不变。
可灵AI(KLing AI)是由快手公司推出的一款面向全球用户的AI视频创意生产制作平台。它利用快手公司自研的先进的可图文生图大模型和可灵AI视频大模型等先进算法和技术,为用户提供高效、便捷的AI视频和图片创作服务。
Magic Eraser 是一款使用人工智能的照片编辑工具,可以轻松从图片中去除不需要的物体、人物、文字等。支持多种图像格式,提供高质量的结果,适用于各种行业和项目。
4、minimax
MiniMax的技术在图像转视频方面有创新应用,如能将静态图像转换为动态视频,还允许用户对视频的外观进行更有效的控制,这一技术可被短视频创作者用于创作内容,也适用于广告、教育和娱乐领域,企业可利用这一工具创建动态的广告内容,教育者则可以将静态教材变为生动的教学视频。
Higgsfield AI的核心产品是Motion Controls,一个强大的AI视频生成平台。该平台具备以下主要功能:
一键生成复杂摄像机运动效果:用户只需提供一张图片和简单的文字提示,Motion Controls就能生成具有推轨、快速变焦、空中俯拍等复杂摄像机运动效果的视频。
多种预设相机模式:平台内置多种预设相机模式,如360度环绕拍摄、子弹时间、动作奔跑镜头等,方便用户快速制作出具有电影化表现力的视频。
高度自定义化:用户可以根据自己的需求,对生成的视频进行高度自定义,包括调整镜头速度、角度、灯光布局等,以实现最佳效果。
注:可以将两个图片合并在一起生成视频
sicnature ---------------------------------------------------------------------
I P 地 址: 216.73.216.141
区 域 位 置: 美国加利福尼亚洛杉矶
系 统 信 息:

Original content, please indicate the source:
同福客栈论坛 | 蟒蛇科普 | 海南乡情论坛 | JiaYu Blog
sicnature ---------------------------------------------------------------------
没有评论