YOLO-World是一个实时目标检测工具,自动识别和定位图像中的多种对象。
MoneyPrinter是一款自动生成与视频文本相关短视频的工具,简化内容创作过程。
notesGPT是一个AI笔记工具,可以将语音转文字、总结内容并生成任务列表。
OOTDiffusion是一款可控的虚拟模特服装试穿工具,支持自动调整服装以适应不同性别和体型。
SoraWebui允许用户通过OpenAI Sora模型在线生成视频,并提供一键网站部署功能。
Sora AI视频生成器提供便捷的工具,助力用户轻松创建个性化视频内容。
Open WebUI 是一个自托管的、功能丰富的界面,支持多种 LLM 运行器,如 Ollama 和 OpenAI API。
Beeble AI通过创新技术,实现图像和视频中超逼真的灯光效果。
Magi官网入口提供精彩的魔法与冒险故事,带您探索神秘的世界。
Comflowy社区开箱即用的 Comfy UI 整合包 一键安装,小白也能轻松上手。ComflowySpace官网入口网址
LangChain是一个开源框架,用于构建基于大型语言模型的应用程序。
Animagine XL 3.1是一款扩展动漫风格理解的文本生成图像模型。
一款漂亮且功能强大的在线海报设计器,图片编辑器,仿稿定设计,迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。迅排设计官网入口网址
一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。StreamMultiDiffusion官网入口网址
一个专注于动漫图像超分辨率的项目,旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。APISR官网入口网址
一款由腾讯研究人员开发的音频驱动的肖像动画合成框架,AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。AniPortrait官网入口网址
IDM-VTON利用视觉编码器和UNet模型生成高质量虚拟试穿图像,提升一致性与真实性。
HiDiffusion通过一行代码实现扩散模型图像生成质速度提升6倍。
Perplexica是一款利用AI和机器学习提供精准搜索结果的开源搜索引擎。
小红书作品采集工具,提取链接、信息及下载无水印作品。
StoryDiffusion是一款由南开大学HVision团队开发的AI工具,专注于生成连贯的图像、视频故事和漫画创作。
ChatTTS提供高质量的中英文对话场景文本转语音服务。
RTranslator是一款开源、离线的Android实时翻译应用,支持蓝牙耳机对话。
一项突破性的卡通着色进步,植根于扩散模型,通过解决四个子问题:风格化、一致性增强、结构指导和着色,将逼真的视频转变为动漫风格。Diffutoon官网入口网址
一个基于 LLM 大语言模型的知识库的集成客服系统,提供开箱即用的智能客服解决方案。懒人客服官网入口网址
一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。Omnivore官网入口网址
硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互。DUIX官网入口网址
一款敏捷的信息挖掘开源免费工具,Wiseflow可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。Wiseflow官网入口网址
闪电般快速的搜索 API,可轻松融入您的应用程序、网站和工作流程,Meilisearch官网入口网址
在多轮交互式图像生成中制作一致的主题,AutoStudio官网入口网址
一个开源的AI 驱动的答案搜索引擎,定位为 Perplexity 的自托管替代品。Farfalle官网入口网址
一个虚拟试穿项目,可以从文本生成可穿戴3D服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。ClotheDreamer官网入口网址
FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进,FreeAskInternet官网入口网址
MimicMotion是一个生成任意长度高质量人体运动视频的框架,支持置信度感知姿势指导。
一个通用型PDF文件处理工具,PDF-Guru包含PDF合并、拆分、旋转、水印、加密、转换等20多项常用功能,完全开源,个人免费使用,界面简洁,简单易用。PDF-Guru官网入口网址
利用AI技术将静态照片转换为视频,展现逼真的面部表情和动作。LivePortrait官网入口网址
一个基于音频驱动的肖像动画生成工具,通过可编辑的特征点条件生成逼真、自然的动画,用户可以根据自己的需求调整动画细节。EchoMimic官网入口网址
一种图像到3D框架,可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。Unique3D官网入口网址
一个开源的人工智能图像处理工具,Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。Cody Former官网入口网址
百度公司推出的视频生成模型,能够以文本和图像的任意组合作为输入条件进行视频生成。UniVG官网入口网址
一个开源的 AI 搜索引擎框架,MindSearch具有与 Perplexity.ai Pro 相同的性能。您可以轻松部署它来构建您自己的搜索引擎。MindSearch官网入口网址
一种深度融合文本理解和语音生成的一项新型语音合成技术,CosyVoice能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。CosyVoice官网入口网址
一个开源的数据标注平台,致力于优化对于大型语言模型(LLM)开发不可或缺的数据标注过程。LabelLLM官网入口网址
MemFree是一个开源混合AI搜索引擎,可从多种来源快速获取精准答案。
一个基于 Postgres 构建的超快速、实时、专业、开发人员友好的无代码数据库。Teable使用简单的、类似电子表格的界面来创建复杂的企业级数据库应用程序,无需编写代码。Teable官网入口网址
阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。Emote Portrait Alive官网入口网址
AI二次元动漫图片生成器,利用AI Anime Generator,你可以通过简单的界面和高效工具轻松进行动漫创作,不需绘画技能即可轻松创作动漫和图画小说。AI Anime Generator官网入口网址
MedisGo是一款免费、易用的视频解析下载工具,支持多种视频格式下载。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适