DragGAN允许用户通过精确控制像素位置,灵活变形图像,操控姿势、形状和表情。
DeepFaceLive是一款基于AI的实时面部合成技术,能将一个人的表情合成到另一个人脸上。
AnimateDiff 是一个在稳定扩散中将文本转换为 GIF 动图的插件。
AI Comic Factory是一个免费开源的AI漫画生成器,支持根据提示词生成漫画。
EmojiGen是一个开源工具,通过输入词语生成相关表情符号。
Platon.AI 提供高速网页理解技术,支持 AI agents 使用在线工具。
CustomNet通过融合物品图片,保留样式和纹理,提升SD商品图的生成效果。
易魔声EmotiVoice是支持中英文的开源TTS引擎,具备2000多种音色和情感合成能力。
Notebook CoPilot 是一个工具,通过输入自动生成代码和 Markdown 单元格,简化开发笔记本的过程。
VideoSrt是一个开源工具,快速为视频生成中英文字幕SRT文件。
Deepfakes Creator通过文本和照片生成逼真的会说话的人物视频。
8spAi系统集成全模型AI问答、创作、绘画等智能化服务。
InvokeAI是一个开源项目,简化了使用Stable Diffusion模型生成高质量图像的过程。
LiveSketch是一款AI工具,将用户的静态素描通过文本提示转化为生动动画。
LucidDreamer通过单个图像和文本提示生成可导航的3D场景。
DreaMoving是一个基于扩散的框架,可生成高质量定制人类舞蹈视频。
ComfyUI Portrait Master简体中文版提供超详细参数设置,方便用户自定义人像提示词。
PIA是一款个性化图像动画生成器,支持高运动可控性和文本图像对齐。
AnyDoor通过图像传输技术,将照片中的物品转移到另一张图片中。
DemoFusion是一个基于BSR Gan技术的开源AI图像重绘增强工具,提升和修复低分辨率图像。
HandRefiner致力于提升AI图像生成中手部图像的准确性和自然度。
M2UGen是一个融合音乐理解与多模态生成的创作框架,助力用户进行音乐艺术创作。
一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。DreamTalk官网入口网址
赛博投简历提供AI自动投递简历、生成求职信并发送给HR的一站式服务。
一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。VideoDrafter官网入口网址
该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。IP-Adapter-FaceID官网入口网址
Audio2Photoreal通过音频生成逼真的虚拟人物形象,具备面部表情、身体和手势动作。
一种基于单图像生成3D一致多视图图像的扩散基础模型。
Make-A-Character可以根据文本描述轻松生成可控、逼真、可动画的3D数字人角色。
开源AI助手解决方案,集成多平台大语言模型及AI绘画功能,带运营管理后台。
Jan.ai是一个开源的人工智能助手,可在本地计算机上完全离线运行。
QAnything AI是一个支持多种文件格式和数据库的开源本地知识库问答系统。
精准复原面部图像,捕捉独特特征并支持换脸技术。
Chatbot UI是一个开源的聊天机器人界面框架,提供增强的ChatGPT用户体验。
PhotoMaker通过多张照片生成个性化人物图像,提取身份特征。
MotionShop利用视频处理和3D渲染技术,高效替换视频中角色而不影响其他场景。
LibreChat 是一个集成多种 AI 模型的免费开源聊天机器人平台。
GPT-SoVITS是一个开源Python框架,允许用户仅用1分钟语音训练TTS模型。
DiffusionGPT是字节跳动开发的多合一系统,利用LLM生成高质量图像。
SupIR是基于大规模扩散的图像恢复模型,能根据文本提示智能修复图像。
Diffuse to Choose是一种基于扩散的图像修复模型,专注于虚拟试穿场景中的细节保留。
DuckDB-NSQL是一个将自然语言转换为DuckDB SQL查询的模型。
StreamRAG是一个视频搜索和流媒体代理工具,让您在ChatGPT中与视频库互动并观看视频。
WhisperFusion提供高效的语音转文字和理解能力,实现超低延迟的AI对话体验。
Audio2Face是一款AI驱动的应用,通过语音生成生动的3D面部动画。
Media2Face是一款可以从音频、图像或文本生成逼真面部动画的工具。
YOLO-World是一个实时目标检测工具,自动识别和定位图像中的多种对象。
MoneyPrinter是一款自动生成与视频文本相关短视频的工具,简化内容创作过程。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适